﻿ Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Cuvânt înainte Acest curs se adreseaz ă studen Ńilor FacultăŃ ii de Informatic ă din Universitatea “Alexandru Ioan Cuza” din Ia i El grupeaz ă materiale pe care primul autor le-a predat în cadrul cursului de Inteligen Ńă Artificială de-a lungul mai multor ani, dar i capitole noi, contribuite de ceilalŃi doi autori foarte recent Un curs cu acest nume a fost introdus în facultatea noastră în anul 1989, de i anumite module care Ńin de această disciplin ă fuseseră predate cu mult timp înainte: astfel prof Costic ă Cazacu preda de mult timp logica rezolutiv ă a lui Robinson iar prof C ălin Ignat preda la acea dată limbajul Prolog De la an la an acest curs s-a modificat (poate nu întotdeauna c ătre mai bine), pe de o parte datorită nestatorniciei domeniului, iar pe de o altă parte, pentru c ă unui profesor îi e imposibil s ă repete acelea i lucruri în doi ani succesivi Idei vehiculate la cursuri i notate grăbit, însemn ări făcute la seminar, copii dup ă cursuri luate de mân ă de studen Ńi i cerute lor dup ă ore, toate acestea s-au adunat i au format, în timp, un material semnificativ Doar de câ Ńiva ani am hotărât s ă culeg aceste materiale în format electronic, întârzâiere care a fost datorată în mare parte descurajării mele în fa Ńa imensităŃ ii materialelor publicate în acest domeniu Dar dacă cedezi în fa Ńa gândului c ă orice ai scrie, cineva trebuie s ă mai fi spus acel lucru altundeva, anii trec, studen Ńii vin i pleac ă i nimic nu prinde contur i nu rămâne La un moment dat, totu i, trebuie s ă la i în urma ta o carte Chiar i atunci când domeniul predat nu coincide cu cel în care îŃi duci activitatea de cercetare, adic ă cel în care inventezi, înc ă po Ńi fi scuzat s ă scrii o carte asupra unui domeniu pe care îl cuno ti (desigur, parŃial) dac ă maniera în care îl descrii îŃi aparŃine i dac ă, adoptând-o în predare, studen Ńii particip ă, se implic ă i se simt bine Predarea nu-i are rost decât atunci când este în Ńeleas ă ca un act de crea Ńie De i un violonist nu scrie partitura pe care o execută, felul în care interpreteaz ă textul muzical îl transform ă într-un creator sau, dimpotriv ă, îl arată ca fiind un reproduc ător de duzin ă Cartea de fa Ńă, poate la fel ca multe altele, cu siguran Ńă n-ar fi existat sau ar fi fost mult mai sub Ńire dac ă a fi Ńinut ca toate ideile redate în ea s ă fi fost inventate de noi, cei trei autori Cele mai frumoase dintre ideile pe care le-am descris aici au fost inventate de alŃii, noi nefiind decât interpre Ńii lor, e drept, în propriul nostru stil Mai toate exemplele îns ă, cu câteva excep Ńii (cazuri în care am men Ńionat sursele), sunt originale Cele mai multe dintre ele nu au anvergura unor aplica Ńii reale ci sunt circumscrise tipului “probleme juc ărie”, atât de mult agreate în didactica acestui domeniu Câteva sunt decupate îns ă din aplica Ńii reale i diminuate pân ă la “juc ărioare” u or de explicat i formalizat În to Ńi ace ti ani de când predau acest curs la Facultate, am avut bucuria s ă lucrez cu mai mulŃi tineri care m-au ajutat la catedră ca asisten Ńi Fiecare dintre ei a lăsat urme asupra genera Ńiilor de studen Ńi i, în diverse moduri, probabil, i asupra acestei c ărŃi Ei sunt: Andrei Adrian, Amalia Todira cu, Adrian Iftene, Petric ă Obreja, precum i colaboratorii mei actuali, co-autorii, M ădălina IoniŃă i Ionu Ń Pistol Le mulŃumesc tuturor, dup ă cum le mulŃumesc acelor studen Ńi ai mei care mi-au făcut bucuria s ă-i reîntâlnesc, la fiecare curs, aten Ńi i deschii s ă primeasc ă noi provoc ări Capitolele din carte au fost contribuite dup ă cum urmeaz ă: capitolele 1-4 – primul autor, capitolul 5 – al doilea autor, capitolul 6 – al treilea autor Dan Cristea 1 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Cuprins 1 Introducere 5 1 1 DefiniŃia Inteligen Ńei Artificiale i un pic de istorie 5 1 2 Testul Turing 5 1 3 Probleme de natură filosofic ă i pragmatic ă 6 1 4 Subdomenii ale inteligen Ńei artificiale 8 1 5 Probleme i solu Ńii IA fa Ńă de probleme i solu Ńii de programare clasic ă 11 1 5 1 Prin ce diferă o problem ă clasic ă de una de IA ? 11 Bibliografie 12 2 LISP 13 2 1 Introducere 13 2 2 Func Ńii, maniere de definire i apel 15 2 2 1 Transparen Ńa referen Ńială 15 2 2 2 Efectul lateral 15 2 2 3 De la nota Ńia lambda la Lisp pur 16 2 2 4 Evaluarea numeric ă fa Ńă de evaluarea simbolic ă 17 2 2 5 Beneficiile unui Lisp impur: Common Lisp 17 2 3 Tipuri de date în Lisp 17 2 3 1 Construc Ńiile limbajului 18 2 3 2 Un pic de sintax ă 18 2 3 2 Liste i reprezentarea lor prin celule cons 21 2 3 3 Perechi i liste cu punct 22 2 3 4 Evaluarea expresiilor 22 2 4 Func Ńii i forme Lisp 24 2 4 1 Nota Ńii 24 2 4 2 Asignarea unei valori unui simbol 26 2 4 3 Func Ńii pentru controlul evalu ării 27 2 4 4 Opera Ńii asupra listelor 27 2 4 5 Opera Ńii cu numere 29 2 4 6 Predicate 33 2 4 7 Liste privite ca mulŃimi 36 2 4 8 Opera Ńii logice i evalu ări controlate 37 2 4 9 Forme pentru controlul evalu ării 38 2 4 10 Liste i tabele de asocia Ńie 39 2 4 11 Loca Ńii i accese la loca Ńii 41 2 4 12 Lista de proprietăŃ i a unui simbol 41 2 4 13 Func Ńii chirurgicale 42 2 4 14 Forme de apelare a altor func Ńii 44 2 4 15 Lambda expresii 44 2 4 16 Lambda-func Ńii recursive 45 2 4 17 Func Ńii de coresponden Ńă 45 2 5 Tehnici de programare în Lisp 48 2 5 1 DefiniŃii de func Ńii 48 2 5 2 Recursivitate 48 Recursivitate coad ă 50 Scrierea func Ńiilor cu recursivitate coad ă prin parametru acumulator 50 2 5 3 Forme de secven Ńiere 51 2 5 4 Formele speciale let i let* 51 2 5 5 Variabile i domeniile lor 53 2 5 6 Leg ări versus asign ări 55 2 5 7 Forme de iterare 56 2 5 8 Valori multiple i exploatarea lor 58 2 5 9 Închideri 59 2 5 10 Transferul argumentelor în func Ńii 60 2 6 Macro-uri 62 2 6 1 DefiniŃie, macroexpandare i evaluare 62 2 6 2 Despre apostroful-stânga ( backquote) 63 2 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială 2 6 3 Asupra manierei de construc Ńie a macro-urilor 64 2 6 4 Cum se testeaz ă macro-expand ările? 66 2 6 5 Asupra destructuriz ării 66 2 6 6 Când să folosim macro-uri? 67 2 6 7 Argumente pro i contra utiliz ării macro-urilor 67 2 7 Un exemplu de program care se modific ă în timpul rulării 68 Bibliografie 70 3 C ăutare Rezolvarea problemelor Sisteme de produc Ńie 72 3 1 Formalizarea problemelor de IA 72 3 1 1 Problem ă, instan Ńă de problem ă, spa Ńiul stărilor 72 3 1 2 Recunoa terea stărilor 74 3 1 3 Reprezentarea stărilor 76 3 1 4 Reprezentarea tranziŃiilor între stări 76 3 1 5 C ăutarea solu Ńiei 78 3 2 Exemple de formaliz ări 80 3 2 1 Maimu Ńa i banana 80 3 2 2 Lumea cuburilor (blocurilor) 84 3 3 Controlul sistemelor de produc Ńie 89 3 3 1 Strategii irevocabile 89 3 3 2 Strategii tentative 94 3 4 Sisteme Expert 108 3 4 1 Tipuri de c ăutări 108 3 4 2 Sistemele Expert (SE) 109 3 5 Concluzie 109 Bibliografie 113 4 Reprezentarea cunoa terii i ra Ńionament 115 4 1 Ontologii 116 4 2 Taxonomii 117 4 3 Paternitate versus monotonie în sisteme ierarhice 118 4 3 1 Solu Ńii în cazul mo tenirilor contradictorii 120 4 4 Re Ńelele semantice descriptive – sisteme ierarhice nemonotone 120 4 4 1 Un exemplu de reprezentare 120 4 4 2 Interog ări în re Ńele semantice 123 4 4 3 Demoni 127 4 4 4 AmbiguităŃ i în reprezentarea prin re Ńele semantice 130 4 5 Re Ńele semantice evenimen Ńiale Inferen Ńe 131 4 5 1 Evenimente aflate în corela Ńie logic ă 133 4 5 2 Un model inferen Ńial 134 Bibliografie 144 5 Probleme de satisfacere a constrângerilor 146 5 1 Introducere 146 5 2 Backtracking în satisfacerea constrângerilor 149 5 2 1 Backjumping 150 5 2 2 Forward-checking 152 5 3 Inferen Ńa 154 5 3 1 Arc-consisten Ńă 155 5 3 2 Bucket-Elimination 157 5 4 Euristici pentru selectarea variabilelor i a valorilor 160 5 4 1 Ordonarea variabilelor 160 5 4 2 Selectarea valorilor 161 5 5 Metode stochastice 162 5 6 Concluzii 162 Probleme 163 Bibliografie 164 6 Înv ăŃ area automată 166 6 1 Descriere generală 166 6 2 Caracteristici ale unui sistem capabil de înv ăŃ are 167 6 2 1 Scopul metodei i baza de cuno tin Ńe necesară 167 3 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială 6 2 2 Formalismul de reprezentare a datelor utilizate i a celor înv ăŃ ate 167 6 2 3 Setul de opera Ńii 168 6 2 4 Spa Ńiul general al problemei 169 6 2 5 Reguli euristice pentru c ăutare 169 6 3 Înv ăŃ area supervizată 169 6 3 1 Concepte inv ăŃ abile PAC 169 6 3 2 Arbori de decizie 170 6 3 3 Calculul câ tigului de informa Ńie 172 6 3 4 Probleme în utilizarea arborilor de decizie 174 6 3 5 Inducerea abloanelor logice 175 6 3 6 Înv ăŃ area Bayesian ă 177 6 3 7 Înv ăŃ area prin încurajare 177 6 3 8 Înv ăŃ area pasiv ă într-un domeniu cunoscut de stări 178 6 3 9 Înv ăŃ area pasiv ă într-un domeniu necunoscut de stări 179 6 3 10 Înv ăŃ area activ ă 179 6 3 11 Algoritmii genetici 180 6 3 12 Înv ăŃ area bazată pe cuno tin Ńe 180 6 3 13 Înv ăŃ area bazată pe explica Ńii 181 6 3 14 Înv ăŃ area bazată pe relevan Ńă 182 6 3 15 Înv ăŃ area inductiv ă bazată pe cuno tin Ńe 182 6 3 16 Dezavantajele înv ăŃării supervizate 183 6 4 Înv ăŃ area nesupervizată 184 6 4 1 Identificarea claselor de instan Ńe 184 6 4 2 Structura cuno tin Ńelor taxonomice 186 6 5 Concluzii 188 Bibliografie 191 4 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Capitolul 1 Introducere Când un venerabil i respectat om de tiin Ńă spune c ă un lucru este posibil, sigur are dreptate Când un venerabil i respectat om de tiin Ńă spune că un lucru este imposibil, sigur se în eală Arthur C Clarke 1 1 DefiniŃia Inteligen Ńei Artificiale i un pic de istorie Luată din Dic Ńionarul Explicativ al Limbii Române (DEX), definiŃia inteligen Ńei pune în eviden Ńă capacitatea individului de a se adapta i de a rezolva situa Ńii noi pe baza experien Ńei acumulate anterior IntuiŃia lexicografului a devansat cercetările de IA – care doar recent au pus pe primul plan cunoa terea, deplasând centrul de greutate al definiŃiei IA c ătre cunoa terea aplicată DefiniŃia Inteligen Ńei Artificiale este dată de Barr&Feigenbaum (Barr, Feigenbaum, 1981): IA este tiin Ńa, parte a informaticii, care proiecteaz ă sisteme artificiale cu comportament inteligent – adic ă sisteme ce manifestă proprietăŃ i pe care în mod obinuit le asociem cu existen Ńa inteligen Ńei în comportamentul uman - în Ńelegerea limbajului, înv ăŃ are, ra Ńionament, rezolvarea problemelor a m d Astfel de sisteme pot răspunde flexibil în situa Ńii ce nu au fost anticipate de programator Precursor al domeniului este considerat Norbert Wiener, care, bazat pe tripla forma Ńie universitară în matematic ă, zoologie i filosofie, reu ete s ă g ăseasc ă în cartea sa Cibernetica sau control i comunica Ńie la om i ma in ă Sintagma Inteligen Ńă Artificială este pronun Ńată îns ă pentru prima oară în 1956 la conferin Ńa de la Darthmouth, Canada 1 2 Testul Turing Introducerea unui arbitru uman într-o dispută având ca scop definirea inteligen Ńei ma inii pare inevitabilă DificultăŃ i de natură filosofic ă fac imposibilă găsirea unei definiŃii riguroase a inteligen Ńei Odată ce acceptăm un amestec uman în această dispută înseamn ă c ă ced ăm empiricului, partizanului, subiectivului, adic ă în fapt recunoa tem imposibilitatea de standardizare într-o chestiune care n-ar fi existat dac ă noi n-am fi existat Suntem capabili a marca inteligen Ńa uman ă pe o scară Q, dar cum putem face distinc Ńia dintre inteligen Ńa uman ă i cea a ma inii? În testul Turing un subiect uman i o ma in ă sunt a ezate în camere distincte de aceea a unui alt personaj uman, numit arbitru Arbitrul comunic ă cu subiectul uman i cu ma ina prin intermediul unei tastaturi i trebuie, prin întreb ări adresate celor doi, s ă decid ă care din ei e omul i care e ma ina În dilema identific ării inteligen Ńei într-o ma in ă, vom constata c ă manifestăm întotdeauna o re Ńinere în a considera c ă o ma in ă e înzestrată cu inteligen Ńă, chiar dac ă răspunsurile ei sunt cele pe care le a teptăm de la un interlocutor uman, pentru c ă vom fi nesiguri dac ă interfa Ńa spectaculoas ă este sus Ńinută de o trăire psihic ă adecvată ori este doar o simulare Un obstacol serios în definirea gradului în 5 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială care o ma in ă poate fi considerată inteligentă, va rămâne diferen Ńa dintre comportament, ce poate fi obiectivat, i acel ceva adânc, personal i indefinibil care provoac ă comportamentul Plasată în condiŃii de test diverse, pân ă la urm ă inteligen Ńa poate fi decantată de fals Apoi IA este un domeniu foarte adânc ancorat într-o realitate pragmatic ă Ceea ce intereseaz ă în fapt este ca ma ina s ă fie capabilă s ă înlocuiasc ă nite sarcini care în mod normal presupuneau prezen Ńa omului Aceste sarcini sunt adesea foarte bine precizate de un cadru al aplica Ńiei i, deocamdată, nu se cere ma inii un comportament universal inteligent 1 3 Probleme de natur ă filosofic ă i pragmatic ă Testul Turing – pentru prima oară publicat în revista Mind, în 1950 Există o competiŃie anuală (http://www cogsci ucsd edu/~asaygin/tt/ttest html) Dificultatea principală constă în încorporarea cunoa terii de bun-sim Ń (common-sense knowledge) în ma in ă Dar testul Turing este contestat de anumiŃi teoreticieni ai domeniului ca fiind relevant pentru a defini inteligen Ńa ma inii Ei argumenteaz ă c ă o ma in ă care ar trece acest test nu ar manifesta inteligen Ńă în aceea i manieră în care un om ar manifesta-o Testul Turing nu d ă decât o privire superficială asupra inteligen Ńei, utilizând un criteriu distinctiv pur pragmatic, pe când adev ărata inteligen Ńă e de natură adânc semantic ă O ma in ă care ar trece testul Turing se spune c ă ar manifesta inteligen Ńă artificială slab ă ( weak AI ) Penrose (Penrose, 1998) nu crede c ă inteligen Ńă adev ărată poate fi cu adev ărat prezentă fără con tiin Ńă i de aici c ă inteligen Ńa nu va putea fi niciodată produs ă de nici un algoritm ce e executat pe o ma in ă El enun Ńă patru puncte de vedere ce pot fi identificate relativ la problema realiz ării inteligen Ńei pe o ma in ă Punctul de vedere mecanicist , sau al inteligen Ńei artificiale tari , confund ă gândirea cu calculul Mai mult decât gândirea, ca manifestare logic ă a unui creier, toate trăirile care implic ă con tiin Ńa reprezintă rezultate ale unor calcule La una din extremele acestui punct de vedere întregul univers e privit ca un imens calculator, mintea omeneasc ă reprezentând doar una din componentele acestui proces de calcul Faptul c ă îns ăi substan Ńa pare a se raporta din punct de vedere computa Ńional la energie (conform formulei lui Einstein E=mc2) întăre te acest punct de vedere dup ă care fenomenele ce se desfăoară în celulele creierului pot fi gândite matematic, deci simulate pe un alt mediu computa Ńional decât cel original Cum toate manifestările interne ale unui creier ar putea fi reproduse pe o ma in ă care efectueaz ă calcule, atunci ar trebui s ă acceptăm c ă pân ă i manifestările interne – con tiin Ńa îns ăi – ar putea fi redate pe o ma in ă În esen Ńă dispare diferen Ńa dintre con tiin Ńă i simularea ei, tot ceea ce se poate petrece pe o ma in ă performantă este adev ăr în aceea i m ăsură în care adev ăr reprezintă trăirile noastre adânci, sentimentele, bucuriile i durerile noastre, ideile pe care le avem ori în Ńelegerea pe care credem c ă o avem fa Ńă de o operă de artă sau o bucată muzicală În conformitate cu acest punct de vedere testul Turing este absolut relevant în depistarea inteligen Ńei artificiale, dac ă o ma in ă răspunde adecvat la întreb ări înseamn ă c ă i în Ńelege acele întreb ări i răspunsurile ei sunt în rezonan Ńă cu procese mentale de profunzime pe care aceste întreb ări le inspiră 6 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Punctul de vedere al inteligen Ńei artificiale slabe acceptă din nou con tiin Ńa ca rezultat al ac Ńiunilor fizice ale creierului i faptul c ă orice ac Ńiune fizic ă poate fi reprodus ă computa Ńional, dar simularea computa Ńională nu treze te sau nu presupune i con tiin Ńă Spre deosebire de punctul de vedere mecanicist un robot care trece testul Turing în mare m ăsură simuleaz ă în Ńelegerea fără ca aceasta s ă aib ă cu adev ărat loc, la nivelul reac Ńiilor o persoan ă i o ma in ă se manifestă la fel, dar ma ina simuleaz ă con tiin Ńa, o raporteaz ă doar, pe când o fiin Ńă o experimenteaz ă Simularea computa Ńională a unui proces este un lucru complet diferit de procesul însu i (Searle, 1992) Searle (Searle, 1980) imagineaz ă un experiment capabil s ă demonstreze c ă un calculator nu are aceea i în Ńelegere ca un om: conceptul de cameră chinezeasc ă În acest experiment se presupune existen Ńa unui calculator supersofisticat capabil s ă „în Ńeleag ă” (în orice accep Ńiune posibilă a acestui termen) un text în chinez ă i s ă răspund ă la întreb ări legate de acesta Textul i apoi întreb ările sunt prezentate ma inii ca iruri de caractere chineze ti pe cartona e, iar răspunsurile acesteia sunt tip ărite i prezentate în aceea i manieră În faza a doua a imaginarului experiment, intervine un individ superdotat, programator, care nu tie o iotă chineze te Lui i se prezintă programul ma inii i i se cere s ă-l aplice pentru a ob Ńine, el însu i, acela i rezultat Dup ă mai mult timp, în care acesta deslu ete programul ma inii, el va fi capabil s ă ob Ńin ă acelea i rezultate ca i ma ina Problema este a adar urm ătoarea: faptul c ă individul uman este acum capabil s ă răspund ă corect unor întreb ări puse într-o limb ă pe care el nu o vorbe te, relative la un text prezentat în aceea i limb ă, ne poate face s ă spunem c ă el „a în Ńeles” acel text i acele întreb ări? E posibil s ă credem c ă atât ma ina cît i individul din experimentul lui Searle ar fi trecut testul Turing (în sensul c ă, plasat în locul calculatorului i deci întrecându-se cu un individ care tie chineze te, arbitrul nu l-ar fi putut demasca) i totu i accep Ńiunea lui „a în Ńelege chineze te” este evident una particulară aici În enun Ńul experimentului s ău Searle reduce problematica la prelucrări dibace de iruri de caractere chineze ti Dintr-un anumit punct de vedere, care se concentreaz ă strict asupra unei perechi de cartona e intrare-ie ire, într- adev ăr avem de a face cu prelucrări de caractere Con tient sau nu, în formularea experimentului camerei chineze ti Searle nu insistă asupra faptului c ă pentru a ob Ńine performan Ńele de prelucrare descrise programul trebuie s ă se ridice de la date prezentate sub form ă de iruri de caractere la concepte Doar transformarea irului de caractere chineze ti din intrare în concepte (care sunt independente de o limb ă sau alta), urmat de capacitatea de a opera cu acestea i de a transpune din nou conceptele în iruri de caractere prezentate în ie ire, ar fi putut face posibilă ob Ńinerea unui rezultat de acest fel Numai c ă această ridicare de la nivelul de prelucrare al irurilor de caractere la cel al unei prelucrări de tip conceptual nu schimb ă cu nimic concluzia Pentru c ă în definitiv i conceptele pot fi etichetate cu iruri de caractere Punctul de vedere realist (îmbrăŃ iat de Penrose, ca i de mine) nu acceptă nici m ăcar posibilitatea unei reproduceri realiste a con tiin Ńei Mai devreme sau mai târziu, dac ă dialogul continu ă, ma ina trebuie s ă se dea de gol Efectele externe ale con tiin Ńei nu pot fi simulate corespunz ător Există manifestări ale con tiin Ńei care nu pot fi explicate prin legile actualmente cunoscute ale fizicii i, ca urmare, nu pot fi reproduse computa Ńional Nu este nici un fel de fetiism în acest punct de vedere Pentru mai multe detalii cititorul este îndemnat s ă consulte cartea lui Penrose 7 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială În sfârit, punctul de vedere mistic este cel conform c ăruia con tiin Ńa nu poate fi explicată în termeni fizici, tiin Ńa e neputincioas ă în tentativa de a explica con tiin Ńa Cu toată aparenta identitate dintre aceste dou ă ultime puncte de vedere, există totu i o mare diferen Ńă între ele: ultimul neag ă a-priori capacitatea tiin Ńei de a cunoa te con tiin Ńa, pe când cel realist afirm ă c ă problema con tiin Ńei con tiente este una tiin Ńific ă i doar incapacitatea noastră momentan ă nu ne permite s ă o pătrundem deplin În ciuda dificultăŃ ilor de a identifica inteligen Ńa artificială cu cea naturală, există puternice motiva Ńii de natură pragmatic ă pentru realizarea de sisteme cu comportament inteligent sau apropiat de cel inteligent A adar, mai pu Ńin aplecat asupra detaliilor demonstra Ńiilor filosofice, domeniul IA este complet absorbit de practic ă Acest lucru se observ ă cu predilec Ńie în apelul la proiecte de cercetare în domeniul tehnologiei informa Ńiei ( Information and Science Technology - IST) din cadrul programului cadru 6 ( framework program 6 – FP6) al Comisiei Europene, lansat în decembrie 2002 (v situl web http://www cordis lu) 1 4 Subdomenii ale inteligen Ńei artificiale Prelucr ările simbolice ( symbolic processing) reprezintă componenta cu preocup ări de programare a domeniului Ea a dus la dezvoltarea unor limbaje specializate în prelucrarea simbolurilor, cel mai cunoscut dintre ele fiind Lisp F ără a neglija aspectele clasice ale program ării, cum ar fi utilizarea numerelor în calcule, în toate aceste limbaje se pune un accent deosebit pe manipularea simbolurilor Un limbaj adecvat prelucrărilor simbolice g ăzduie te cu u urin Ńă reprezentarea i manipularea simbolurilor de orice natură, nu numai numerice Pentru c ă inteligen Ńa artificială se bazeaz ă în mare măsură pe manipularea simbolurilor, Lisp este considerat limbajul de cas ă (sau nativ) al inteligen Ńei artificiale Un tip particular de prelucrări simbolice sunt confruntările de abloane ( pattern matching) abloanele sunt obiecte abstracte formate din p ărŃi definite riguros i altele doar schiŃate abloanele sunt utilizate pentru reg ăsirea de obiecte ce satisfac anumite constrângeri în mulŃimi de obiecte asem ănătoare Procesare simbolic ă i limbaje de procesare simbolic ă În general se acceptă c ă sistemele inteligente din natură prelucreaz ă dou ă tipuri de informa Ńii: de natură simbolic ă sau concentrată i de natură difuz ă, distribuită Calculatoarele noastre, prin proiectare, sunt destinate a manipula numere i caractere, având compartimente special proiectate pentru realizarea performantă de calcule numerice Lucrul cu simboluri (iruri de caractere, imagini sau sunete) de i realizabil pe calculatoarele clasice, necesită tehnici speciale mulate pe natura digitală a aparatului de calcul Ma ina uzuală pe care o avem la dispoziŃie nu are cablate disponibilităŃ i de a opera cu simboluri, de a realiza reg ăsiri simbolice pe baz ă de asocia Ńii, ori de a forma alŃi simboluri prin compunere Manipularea simbolurilor necesită un aparat logic i un suport adecvat de calcul (o ma in ărie) Aparatul logic este dat de logica simbolic ă care reprezintă atît un model de formalizare a cuno tin Ńelor cît i o metod ă de ra Ńionament Ma in ăria este asigurată de limbajele de procesare simbolic ă capabile a simula un comportament adecvat prelucrărilor simbolice mulat pe natura slab simbolic ă a ma inii Dintre acestea, putem identifica: 8 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Lisp – în paradigma func Ńională, Prolog – în paradigma logic ă i Clips – în paradigma bazată pe reguli1 Reprezentarea cunoa terii (knowledge representation) Putem interac Ńiona cu mediul înconjurător pentru c ă, pe de o parte, datorită sim Ńurilor, intrăm în leg ătură cu ea, iar pe de altă parte o "în Ńelegem" a a cum este Ca sa în Ńelegem realitatea avem îns ă nevoie de a o "proiecta" în mintea noastră Această proiec Ńie este o reprezentare a realităŃ ii F ără a avea o reprezentare asupra unei entităŃ i nu putem emite judec ăŃ i asupra ei Reprezentarea implic ă, în principiu, trei componente: o nota Ńie, o denota Ńie i un calcul Nota Ńia este un desen, sau o structură de date, care respectă anumite conven Ńii (date de obicei de o sintax ă) Conota Ńia, sau semantica, este interpretarea pe care o d ăm nota Ńiei, din nou pe baza unui sistem de conven Ńii Fără aceste reguli de interpretare nota Ńia este superflu ă În sfârit o reprezentare trebuie s ă includ ă un model computa Ńional care s ă fac ă posibilă operarea cu obiectele i rela Ńiile dintre obiecte ce compun reprezentarea Datorit ă modelului de calcul entităŃ ile modelate prind via Ńă, putându-se studia astfel comportamentul lor în condiŃii ce simuleaz ă de aproape realitatea Ra Ńionament automat i demonstrarea teoremelor (theorem proving, problem solving) Cea mai veche ramură a IA i cea mai teoretic ă dintre ele, utilizeaz ă logica ca sistem formal de g ăsire a demonstra Ńiilor i de generare a inferen Ńelor automate Foarte multe probleme pot fi formalizate ca probleme de matematic ă sau logic ă, rezolvarea lor reducându-se la o demonstrare a unei teoreme plecând de la un sistem de axiome i utilizând un mecanism de deduc Ńie logic ă Ca i în alte cazuri, dificultăŃ ile rezid ă în num ărul extrem de mare de posibilităŃ i ce pot apare Pentru controlul exploziei de posibilităŃ i în c ăutarea unei solu Ńii se utilizeaz ă de multe ori solu Ńii euristice, care de i nu garanteaz ă solu Ńia optim ă, pot în general duce la g ăsirea uneia, cel pu Ńin ÎnŃelegerea limbajului natural ( natural language processing) Este de mult acceptat c ă utilizarea limbajului este o caracteristic ă definitorie a inteligen Ńei De i nou ă ne vine atât de u or s ă comunic ăm prin limbaj, o încercare de explicitare a mecanismelor care stau la baza înŃelegerii textelor ori a limbajului vorbit se dovede te deosebit de dificilă În domeniul în Ńelegerii limbajului natural trebuie întîi stabilită o distinc Ńie între a în Ńelege un mesaj comunicat prin voce i a în Ńelege un mesaj scris De prima chestiune se ocup ă domeniul de cercetare al interpretării vorbirii ( speech processing) Problema în Ńelegerii limbajului – în varianta scris ă – face obiectul a dou ă tipuri de preocup ări Lingvistica computa Ńională pe de o parte, ca domeniu pur academic, pune în discu Ńie modele computa Ńionale ale limbajului natural cu scopul de a investiga i descoperi natura însu i a limbajului i a abilităŃ ilor cognitive umane Ingineria Lingvistic ă (sau în varianta predominant american ă, Tehnologia Limbajului Uman), pe de altă parte, este preocupată de a dezvolta 1 Paradigmele de programare sunt stiluri ori precepte generale de programare transpuse în caracteristicile unor limbaje Astfel în cadrul paradigmei imperative se clasific ă limbajele bazate pe comenzi, paradigma func Ńională pune la baza program ării no Ńiunea matematic ă de func Ńie ideea de baz ă fiind c ă un program înseamn ă un apel de func Ńie, paradigma orientată obiect aduce în prim plan no Ńiunea de obiect înzestrat cu proprietăŃ i i metode, paradigma logic ă realizeaz ă un program ca o demonstra Ńie de teorem ă, în paradigma bazată pe reguli un program reprezintă o colec Ńie de reguli i un motor aplic ă aceste reguli într-o anumită ordine 9 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială aplica Ńii care se bazeaz ă pe utilizarea limbajului natural, orientate spre industrie, comerŃ, sfera socialului sau cea educa Ńională2 Vederea artificială (vision) Cinci sim Ńuri3 (vederea, auzul, sim Ńul tactil, mirosul i gustul) ne stau la dispoziŃie pentru a interac Ńiona cu mediul, pentru a lua cuno tin Ńă de ceea ce se află în afara corpului nostru, în imediata noastră vecin ătate Pentru a ne prelungi "b ătaia" acestor sim Ńuri am inventat aparate care ne ajută s ă vedem ori s ă auzim la distan Ńă Modelarea acestor sim Ńuri pe sisteme automate reprezintă cu certitudine, o preocupare de mare însemn ătate a domeniului IA Dintre cele cinci, vederea ocup ă un loc privilegiat Sistemele de vedere artificială încearc ă s ă descifreze mecanismele vederii i ale interpretării imaginilor statice i în micare Planificare i robotic ă (robotics) Sistemele inteligente vii au abilitatea de a găsi solu Ńii de deplasare în spa Ńiu în vederea atingerii unor obiective sau de mutare a unor obiecte folosind bra Ńele C ăutarea unui drum pe un teren accidentat (lunar, de exemplu, sau pe fundul oceanelor) sau într-un spa Ńiu pres ărat cu obstacole (cum este o cameră) nu este o problem ă simplă, nu în ultimul rând datorită num ărului mare de posibilităŃ i de alegere la fiecare pas, complexitate ce face imposibilă tentativa c ăutării exhaustive Încercând a modela procesele cognitive care se desfăoară în sistemele vii, planificarea robo Ńilor este un câmp de cercetare care urm ăre te a îmbun ătăŃ i comportamentul robo Ńilor atunci când ei sunt programa Ńi a executa diferite sarcini Înv ăŃ are automată (learning) Un sistem înzestrat cu inteligen Ńă este capabil să înve Ńe pentru a-i îmbun ătăŃ i interac Ńiunea cu mediul El poate înv ăŃ a fie din gre eli, prin auto-perfec Ńionare, fie ghidat de un profesor, fie generalizând, fie prin analogie, sau din exemple pozitive i negative Domeniul înv ăŃării automate formalizeaz ă aceste metode i caută aplicarea lor la sistemele automate Sisteme expert (expert systems) Puterea stă în cunoa tere Aplicarea acestui truism în sisteme artificiale înseamn ă dotarea lor cu abilitatea de a se servi de cunoa tere specific ă (cunoa tere expert) Un medic este bun în g ăsirea unui diagnostic pentru c ă are un bagaj de cuno tin Ńe generale dar i specifice despre boli i bolnavi ParŃial această cunoa tere a deprins-o din c ărŃi, parŃial în cursul anilor de experien Ńă clinic ă, prin atâtea cazuri în care s-a implicat AchiziŃionarea, formalizarea i includerea cunoa terii expert în sistemele artificiale reprezintă scopul domeniului Sistemelor Expert Cursul nostru va dezbate cu prec ădere probleme de această natură 2 DefiniŃiile sunt preluate dintr-un recent mesaj difuzat pe lista corpora@hd uib no de Prof Geoffrey Sampson, School of Cognitive & Computing Sciences, University of Sussex, care la rândul s ău citeaz ă un articol publicat într-un num ăr recent al revistei Natural Language Engineering 3 Cercetări noi las ă speran Ńa c ă vom înv ăŃ a s ă ne servim de înc ă alte sim Ńuri din sfera para-normalului, ce la majoritatea dintre noi sunt de utilitate subliminală, dar pentru care alŃii manifestă o dotare aparte 10 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială 1 5 Probleme i solu Ńii IA fa Ńă de probleme i solu Ńii de programare clasic ă 1 5 1 Prin ce difer ă o problem ă clasic ă de una de IA ? Există o seam ă de trăsături care diferen Ńiaz ă câmpul IA de alte domenii ale informaticii ( computer science) Cursul de fa Ńă încearc ă s ă conving ă cititorul c ă măcar urm ătoarele trăsături pot fi considerate definitorii: • Ce face ca o problem ă s ă fie considerată de IA, iar o alta nu? - problemele de IA necesită în general un ra Ńionament predominant simbolic; - probleme care îmbie la investiga Ńii IA sunt i cele care manipuleaz ă informa Ńie incompletă ori nesigură; • Ce face ca o solu Ńie s ă fie considerată ca fiind caracteristic ă metodelor IA? - de cele mai multe ori nu este de natură algoritmic ă Adesea, ea este ob Ńinută în urma unei c ăutări într-un spa Ńiu al solu Ńiilor posibile; - solu Ńiile ce se cer nu trebuie cu necesitate s ă fie cele mai bune sau exacte Uneori e suficient dac ă o solu Ńie este g ăsită, sau dac ă o formulare aproximativ ă a ei este ob Ńinută; - în rezolvarea problemelor de IA adesea intervin cantităŃ i foarte mari de informa Ńii specifice G ăsirea unui diagnostic medical nu poate fi algoritmizat pentru c ă diferen Ńele de date asupra pacientului incumb ă tipuri însu i de solu Ńii diferite De aceea doctorii spun c ă nu există boli i doar pacien Ńi; - natura cunoa terii ce se manipuleaz ă în problemele de IA poate fi u or departajată în procedurală i declarativ ă: este diferen Ńa dintre cunoa terea pe care o posed ă cu p ăianjen i un inginer constructor de poduri, sau diferen Ńa dintre cunoa terea pe care o posed ă un juc ător de tenis i un bun antrenor Cunoa terea unuia se află ‘în vârful degetelor’, a celuilalt într-un sistem de reguli • Pot probleme de IA fi rezolvate prin algoritmi clasici ? - Cu siguran Ńă c ă da, dar solu Ńiile vor fi probabil greoaie, greu generalizabile, nefire ti i neelegante • Invers: pot probleme clasice fi rezolvate prin metode ale IA ? - Iarăi lucrul este posibil, dar e ca i cum am folosi un strung ca s ă ascu Ńim un creion De ce un program de calcul al salariilor nu este un program de IA pe când a face un robot s ă m ăture prin cas ă fără a distruge mobila, sau a face un program s ă recunoasc ă figuri umane este o aplica Ńie de IA? Distinc Ńia dintre cunoa terea procedurală i cea declarativ ă Trăsături ale cunoa terii declarative: • poate fi schimbată mai rapid i mai u or pentru c ă este de natură discretă; • poate fi folosită la mai multe scopuri decât la cel imaginat iniŃial; 11 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială • poate fi extins ă prin procese de ra Ńionament care adaug ă cunoa tere nou ă; • poate fi accesată de programe de introspec Ńie care s ă ofere explica Ńii la cerere Nivelul actual al cercetărilor i realiz ărilor în IA Exemple de direc Ńii de cercetare particulare în IA: sisteme inteligente pentru biologie moleculară (pân ă în 1997 – s-au Ńinut 5 conferin Ńe interna Ńionale pe această tem ă, începând din 93); robo Ńi inteligenŃi – competiŃii de robo Ńi inteligen Ńi (primul Ńinut la San Jose, California, în 1992, în 1996 –a 5-a ediŃie, în Portland, Oregon) • sisteme expert (medicin ă, chimie, geologie, configurarea sistemelor de calcul, descoperirea legilor fizicii); • ra Ńionament automat, demonstrarea de teoreme; • verificarea programelor; • matematic ă simbolic ă (calcul diferen Ńial, integral, manipularea expresiilor); • jocuri (ah, table, checkers) • interfe Ńe în limbaj natural la baze de date i de cuno tin Ńe; • sisteme de întrebare-răspuns pe domenii limitate sau largi; • sisteme de traducere automată; • senzori inteligen Ńi; • controlul robo Ńilor sta Ńionari i mobili (linii de asamblare, robo Ńi subacvatici sau spa Ńiali) Cerin Ńe pentru studen Ńi • Să cunoasc ă semnifica Ńia i detaliile testului Turing • Să cunoasc ă definiŃia domeniului IA i cu ce se ocup ă subdomeniile sale • Să poată distinge o problem ă de IA de una clasic ă Bibliografie Barr, A , Feigenbaum, E 1981 The handbook of Artificial Intelligence William Kaufmann, Inc Se poate consulta la Biblioteca Seminarului Matematic de la Facultatea de Matematic ă a UniversităŃ ii ”Al I Cuza” Penrose, R 1989 The Emperor's New Mind: Concerning Computers, Minds and the Laws of Physics, Oxford University Press, New York Tradus ă în limba român ă de Cornelia C Rusu i Mircea V Rusu ca "Mintea noastră… cea de toate zilele: Despre gândire, fizic ă i calculatoare", Ed Tehnic ă, Bucure ti 1996 Penrose, R 1994 Shadows of the Mind, Oxford University Press Tradus ă în limba român ă de Dana Jalobeanu ca "Incertitudinile ra Ńiunii (Umbrele min Ńii) În c ăutarea unei teorii tiin Ńifice a con tiin Ńei", Ed Tehnic ă, Bucure ti, 1999 Searle, J R 1980 Minds, brains and programs În „The behavious and brain sciences”, vol 3, Cambridge University Press Searle, J R 1992 The rediscovery of the mind MIT Press, Cambridge University Press, Massachusetts 12 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Capitolul 2 LISP Mintea func Ńioneaz ă ca o para ută: e utilă doar când e deschis ă Lord Thomas Dewar 2 1 Introducere Inten Ńia acestui capitol nu este aceea de a da o descriere exhaustiv ă a limbajului LISP ci de a introduce no Ńiunile esen Ńiale ale lui, care s ă fac ă posibilă scrierea de aplica Ńii simple la capitolele de inteligen Ńă artificială ce urmeaz ă Nu vrem ca prezentarea s ă urm ăreasc ă cu necesitate un anumit dialect de Lisp Toate exemplele noastre vor putea îns ă fi rulate direct în Allegro Common Lisp, versiunea de Common Lisp creată de Franz Inc (www franz com) Common Lisp (Steele, 1990) este dialectul pe care l-a dezvoltat Comisia de standardizare a Lisp-ului X3J13 din cadrul ANSI ( American National Standard Institute) Datorită flexibilităŃ ii deosebite a limbajului, care parc ă invită la implementări aventuroase, procesul de standardizare a fost unul de durată, dar dup ă anul 1990 a fost finalizat în varianta care este acceptată astăzi de cele mai multe implementări Common Lisp Lisp – limbajul proiectat special pentru problema pe care o am de rezolvat Dac ă ar fi s ă inventăm o reclam ă pentru promovarea limbajului Lisp, ar trebui, probabil, s ă ne exprim ăm astfel: • Lisp este limbajul care g ăzduie te, cu simplitate i elegan Ńă, conceptul de prelucrare a datelor cunoscut sub numele de prelucrare simbolic ă F ără a neglija calculul numeric, limbajele simbolice au facilităŃ i speciale de a lucra cu simboluri nenumerice • Lisp este unul dintre limbajele care exemplific ă paradigma de programare func Ńională4 O func Ńie este un obiect matematic care întoarce o unic ă valoare pentru un set de valori date în intrare Toate construc Ńiile unui limbaj func Ńional pur sunt func Ńii care întorc valori atunci când sunt evaluate Lisp, ca i multe dintre suratele lui func Ńionale, a acceptat îns ă i efecte laterale în evaluarea func Ńiilor, care de i l-au impurificat i-au m ărit expresivitatea • Lisp este limbajul care se muleaz ă pe problema pe care o ave Ńi de rezolvat Această afirma Ńie trebuie în Ńeleas ă în sensul ergonomiei excep Ńionale pe care o oferă limbajul actului de programare Programarea în Lisp este, pentru un cunosc ător, o plăcere, un spectacol i o invita Ńie la crea Ńie Programarea în Lisp este u oară iar productivitatea limbajului este remarcabilă Lispul este adesea mai concis decât alte limbaje 4 Alături de Erlang – pentru aplica Ńii concurente, R – pentru prelucrări statistice, Mathematica – pentru matematic ă simbolic ă, APL – cunoscut mai ales pentru facilităŃ ile de a opera cu matrici, extensia ulterioară a acestuia J, K – pentru analiz ă financiară, XSLT – pentru transformarea documentelor XML, cât i limbajele noi ML (al lui Robin Milner), cât i Miranda (David Turner) i urma ul acestuia Haskell (dezvoltat de Haskell Curry) 13 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială • Lisp este limbajul care se dezvoltă pe m ăsur ă ce rezolva Ńi problema Această trăsătură provine din utilizarea macrourilor – secven Ńe de cod ce suportă execu Ńii specială Prin macrouri se poate da nu numai o nou ă interpretare no Ńiunii de evaluare a formelor limbajului, ci se poate schimba îns ăi sintaxa Se pot crea în acest fel linii de cod care nu mai seam ănă deloc cu sintaxa obinuită a limbajului • Lisp este un limbaj specializat pentru prelucrarea listelor , ceea ce se reflectă în chiar numele lui (LISt Processing) Motivul pentru care lista, o structură de date relativ nespectaculoas ă, poate sta la baza unui limbaj dedicat dezvoltării de aplica Ńii într-un domeniu atât de preten Ńios precum inteligen Ńa artificială este c ă această structură este extrem de generală, o listă putând înlănŃui nu numai simboluri precum numere i cuvinte ci i alte liste, oferind posibilitatea reprezentării de o manieră uniform ă a unor structuri oricât de complicate • Lisp este limbajul „de cas ă” al inteligen Ńei artificiale Caracteristicile ce-i conferă această calitate sunt: facilitatea de a lucra cu simboluri, lista – ca structură fundamentală de date, mecanismele complexe de evaluare i utilizare a macrourilor, care pot duce la construc Ńii procesuale sofisticate i care se comportă diferit în func Ńie de context Lisp faciliteaz ă o abordare multi-strat în programare Implementările orientate- obiect ale acestui limbaj îi conferă toate trăsăturile cunoscute ale paradigmei În mod particular, programarea multi-strat înseamn ă construc Ńia de straturi de definiŃii func Ńionale, ceea ce invită la o abordare bottom-up în rezolvarea problemelor, în a a fel încât apelurile de la un nivel superior s ă incorporeze definiŃii de func Ńii i construc Ńii de pe un nivel inferior Programarea multi-strat este cu deosebire o abordare care se preteaz ă dezvoltării proiectelor mari, care necesită lucru în echip ă, uneori conlucrarea mai multe echipe A a cum se sugereaz ă în Figura 2 1, într-o abordare de jos în sus, se pleac ă de la un nivel de baz ă pentru a se construi deasupra lui un num ăr de niveluri derivate Pe nivelul de baz ă se află diferite componente ale problemei care trebuie rezolvată într-un anumit limbaj de programare Prin utilizarea posibilităŃ ilor oferite de limbaj se creeaz ă deasupra acestuia un prim nivel de instrumente ori func Ńii, capabile s ă fac ă fa Ńă cerin Ńelor problemei i, eventual, chiar s ă le dep ăeasc ă Acest nivel poate fi v ăzut ca un alt limbaj, superior celui aflat la baz ă În acela i mod, nivelurile superioare se creeaz ă deasupra celor imediat inferioare, pân ă la atingerea specifica Ńiilor proiectate În particular, Lisp-ul invită nu numai la crearea unor limbaje de nivel intermediar bazate pe definiŃii de func Ńii i în care construc Ńiile s ă rezulte prin manipularea apelurilor, ci inclusiv la inventarea unor sintaxe speciale care s ă se integreze cerin Ńelor nivelurile de proiectare respective Invers, într-o abordare de sus în jos, se pleac ă de la o proiectare iniŃială a solu Ńiei Această solu Ńie, definită în termeni generali, face apoi obiectul unor rafinamente succesive, pân ă la rezolvarea efectiv ă a problemei Dificultatea într-o astfel de abordare constă în centrarea proiectului iniŃial pe solu Ńie fără a se sc ăpa din vedere aspecte ce ar putea s ă o fac ă neaplicabilă pe unele cazuri speciale – „capetele problemei” Într-o astfel de deplasare nefericită nu deranjeaz ă acoperirea 14 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială unor aspecte neavute în vedere iniŃial ci neacoperirea altora care sunt esen Ńiale în rezolvarea problemei cazuri neprev ăzute în proiect, posibil a fi acoperite de solu Ńie cazuri prev ăzute în proiect dar neacoperite de solu Ńie cazuri prev ăzute în proiect i proiectarea de jos în sus proiectarea de sus în jos acoperite de solu Ńie Figura 2 1: Crearea programelor bottom-up fa Ńă de top-down 2 2 Func Ńii, maniere de definire i apel 2 2 1 Transparen Ńa referen Ńială Spunem c ă o func Ńie este transparentă referen Ńial dac ă valoarea întoars ă de ea depinde numai de parametrii pe care i-a primit în intrare Astfel, dac ă scriem în limbajul C: function foo1(x) { return(x+2); } valoarea întoars ă de func Ńia foo1 depinde, la orice apel al ei, numai de valoarea intrării x Dac ă îns ă o transform ăm în: int a=2; int function foo2(int x) { return(x+a); } atunci valoarea întoars ă de foo2 la un apel al acesteia de forma foo2(3), de exemplu, depinde nu numai de valoarea intrării x, care este 3 în cazul de fa Ńă, ci i de a variabilei globale a ( 2 în cazul de fa Ńă) Spunem deci c ă foo1 este transparentă referen Ńial în timp ce foo2 – nu 2 2 2 Efectul lateral Se spune c ă o func Ńie are un efect lateral dac ă evaluarea ei adaug ă contextului i alte modific ări decât strict valoarea întoars ă de func Ńie Astfel, func Ńia foo1 definită mai sus nu are efecte laterale, în timp ce func Ńia foo3 de mai jos, are: int a; function foo3(int x) { a := x+2; 15 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială return(a); } pentru c ă, în afara valorii întoarse, ea mai provoac ă asignarea unei valori variabilei globale a 2 2 3 De la nota Ńia lambda la Lisp pur Lisp este unul dintre cele mai vechi limbaje de programare aflate înc ă în larg ă utilizare (numai FORTRAN este mai vechi decât el) Primele specifica Ńii ale limbajului au fost elaborate de John McCarthy, în 1958 i publicate în 1960 (McCarthy, 1960), pe baza calculului-l dezvoltat de Alonso Church (Church, 1941) i a unor dezvoltări precedente ce au aparŃinut în principal lui Herbert Simon i Allen Newell ( Logic Theory Machine i General Problem Solver , programe dezvoltate în limbajul IPL inventat de Newell) În nota Ńia lambda, într-o definiŃie de func Ńie se pun în eviden Ńă parametrii formali ai func Ńiei i corpul ei: l(x) = x+2; sau: l(x,y) = x+y; Într-o astfel de nota Ńie func Ńiile nu au nume Asocierea unui nume func Ńiilor, în vederea cre ării posibilităŃ ii de apel al lor, trebuie făcută explicit: function f: l(x) = x+2; function g: l(x,y) = x+y; Într-un apel de func Ńie trebuie s ă apară numele ei urmat de o listă de parametri actuali: f(3) g(5,1) Un apel poate, în anumite condiŃii, s ă amorseze un proces de evaluare care să duc ă la generarea unui rezultat În evaluare se disting dou ă faze: prima în care parametrii formali ai func Ńiei sunt lega Ńi la valorile corespunz ătoare ale parametrilor actuali din corpul definiŃiei func Ńiei i a doua în care are loc evaluarea expresiei astfel ob Ńinute a corpului func Ńiei În evaluarea corpului pot s ă intervin ă alte apeluri de func Ńie, care se deruleaz ă în aceea i manieră Astfel se pot apela func Ńii în func Ńii Spunem c ă un apel poate, în anumite condiŃii, porni un proces de evaluare, pentru c ă o scriere precum f(3) nu garanteaz ă efectuarea evalu ării Ea nu este decât o simplă nota Ńie pân ă ce se comand ă explicit unui evaluator (uman sau ma in ă) începerea unui astfel de proces: 16 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială g(f(3),1) >>> g(5,1) >>> 6 unde >>> trebuie citit „se evalueaz ă la” Între caracteristicile esen Ńiale care definesc a a-numitul Lisp pur se num ără faptul c ă func Ńiile sunt transparente referen Ńial, c ă func Ńiile nu au efecte laterale i c ă din limbaj lipsesc asign ările 2 2 4 Evaluarea numeric ă fa Ńă de evaluarea simbolic ă Fie func Ńia f definită mai sus Apelată asupra parametrului 3 avem o evaluare numeric ă: f(3) >>> 3 + 2 >>> 5 Dac ă îns ă parametrul actual care ia locul parametrului formal x din corpul definiŃiei func Ńiei este unul nenumeric, s ă zicem a, atunci avem de a face cu o evaluare simbolic ă: f(a) >>> a + 2 pentru că forma rezultată con Ńine un simbol nenumeric 2 2 5 Beneficiile unui Lisp impur: Common Lisp Pe considerente de cre tere a puterii de expresie a limbajului i de m ărire a productivităŃ ii activităŃ ii de programare, Lisp-ul pur a fost ulterior impurificat în absolut toate direc Ńiile posibile, fără îns ă a pierde, prin aceasta, sclipirea de geniu originală Astfel, dup ă cum vom constata în cele ce urmeaz ă, s-au acceptat definiŃii de func Ńii care s ă nu mai respecte trăsătura de transparen Ńă referen Ńială (fără a le face îns ă astfel opace referen Ńial ), s-au încurajat efectele laterale, s-au adoptat câteva opera Ńii de asignare, ba chiar s-a permis ca o func Ńie s ă întoarc ă mai mult decât o unic ă valoare, această din urm ă „trădare” făcându-se îns ă, aparent paradoxal, fără s ă se încalce câtu i de pu Ńin definiŃia matematic ă a func Ńiei (o coresponden Ńă de la un domeniu de intrare la un domeniu de ie ire în care oric ărei valori de intrare îi corespunde o singură valoare de ie ire) 2 3 Tipuri de date în Lisp Schema urm ătoare face o clasificare a celor mai uzuale tipuri de date în Lisp: s-expresie (expresie simbolic ă – symbolic expression) atom numeric întreg ra Ńional (frac Ńie) real complex 17 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială nenumeric (în fapt atom literal , noi îi vom numi atom simbolic sau, simplu, simbol ) listă listă simplă listă cu punct ir ( array) ir de caractere tablou (cu oricâte dimensiuni) tabelă de asocia Ńie ( hash table) – structură de date care permite asocierea i reg ăsirea cu u urin Ńă a valorilor ata ate simbolurilor; pachet (sau spa Ńiu de nume) – colec Ńii încapsulate de simboluri Un parser Lisp recunoa te un nume prin c ăutarea lui în pachetul curent; flux de date – surs ă de date, tipic ir de caractere, utilizată pentru canalizarea opera Ńiilor de intrare/ie ire Numai datele au tipuri O variabilă în Lisp nu are definit un tip Ea poate primi ca valoare orice tip de dată 2 3 1 Construc Ńiile limbajului În Lisp operăm cu urm ătoarele categorii de obiecte: variabile, constante, date, func Ńii, macro-uri i forme speciale (la acestea mai trebuie ad ăugate clasele i metodele în implementările orientate-obiect) Variabilele sunt asocia Ńii între simboluri utilizate în anumite spa Ńii lexicale ale limbajului i valori asociate acestora Dup ă cum vom vedea mai departe, există trei moduri prin care o variabilă poate s ă primeasc ă valori, uneori chiar mai multe odată: prin asignare, prin legare i prin intermediul listelor de proprietăŃ i Dou ă dintre aceste moduri de a primi valori (asignarea i listele de proprietăŃ i) sunt caracteristice oric ărui simbol Lisp Ceea ce diferen Ńiaz ă un simbol lexical de o variabilă sunt numai situa Ńiile în care variabilele pot fi legate la valori Constantele sunt simboluri (în general ale sistemului) care au ata ate valori ce nu pot fi modificate În Lisp nu există proceduri ci numai func Ńii, în sensul c ă orice rutin ă întoarce obligatoriu i o valoare Macro-urile sunt func Ńii care au un mecanism de evaluare special, în doi pa i: expandarea i evaluarea propriu-zis ă (prezentate în sec Ńiunea 2 6 Macro-uri) Formele speciale sunt func Ńii de sistem care au, în general, o sintax ă i un comportament aparte 2 3 2 Un pic de sintax ă Urm ătoarele caractere au o semnifica Ńie specială în Lisp: ( – o parantez ă stâng ă marcheaz ă începutul unei liste; ) – o paranteză dreaptă marcheaz ă sfâritul unei liste; ’ – un apostrof, urmat de o expresie e, ’e, reprezintă o scriere condensată pentru un apel (quote e); 18 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială ; – punct-virgula marcheaz ă începutul unui comentariu El însu i, împreun ă cu toate caracterele care urmeaz ă până la sfâritul rândului, sunt ignorate; ” – între o pereche de ghilimele se include un ir de caractere; \ – o bară oblic ă stânga prefixeaz ă un caracter pe care dorim s ă-l utiliz ăm în contextul respectiv ca o literă i nu cu semnifica Ńia lui uzuală De exemplu, irul de caractere ”a\”B” este format din trei caractere: a, ” i B pentru c ă cel de al doilea rând de ghilimele nu trebuie considerate ca închizând irul ci ca un simplu caracter din interiorul lui; | – între o pereche de bare verticale poate fi dat un ir de caractere speciale pe care dorim s ă le utiliz ăm într-un nume de simbol Inclusiv caracterul bară oblic ă stânga (\) poate apare între o pereche de bare verticale, dar ea îi p ăstreaz ă semnifica Ńia de prefix În particular, ea poate prefixa o bară verticală între o pereche de bare verticale Astfel, irurile: |& +\:;| a|& +\|:;|b a|& +\| 2) |b unde prin am notat caracterul rând-nou ( new line), pot constitui nume de simboluri; # – un diez semnaleaz ă c ă urm ătorul caracter define te modul în care trebuie interpretată construc Ńia care urmeaz ă Cea mai importantă utilizare a diezului este de a semnala o form ă func Ńională, într-o secven Ńă de genul: #’fn, unde fn este un nume sau o lambda expresie (definiŃie de func Ńie fără nume); ` – un accent invers semnaleaz ă c ă ceea ce urmeaz ă este un template care con Ńine virgule (mai multe despre template-uri, în sec Ńiunea 2 6 2 Despre apostroful-stânga) Un template func Ńioneaz ă ca un program care modific ă forma unui ir de obiecte Lisp; , – virgulele sunt utilizate în interiorul template-urilor pentru a semnala cazuri speciale de înlocuiri; : – dou ă puncte semnaleaz ă, în general, c ă urm ătorul simbol trebuie privit ca un simbol constant care se evalueaz ă la el însu i În alte cazuri, dou ă puncte despart numele unui pachet de numele unei variabile definite în acel pachet (de exemplu, în user1:alpha, user1 este numele unui pachet, iar alpha este numele unei variabile) Implementările uzuale de Common Lisp sunt insensibile la forma caracterelor (minuscule sau majuscule) Intern îns ă, formele Lisp sunt reprezentate cu majuscule, de aceea formele rezultate în urma evaluărilor sunt redate în astfel de caractere Numerele întregi zecimale pot fi precedate op Ńional de un semn i urmate op Ńional de un punct zecimal (ad ăugarea unui zero dup ă punct le transform ă îns ă în numele reale) Numere întregi în alte baze au sintaxa #nnRddddd sau #nnrddddd, în care nn exprim ă baza iar ddddd – num ărul Bazele 2, 8 i 16 permit i o altă scriere, respectiv #b pentru #2r, #o pentru #8r, i #x pentru #16r Frac Ńiile , sau numerele ra Ńionale, sunt reprezentate ca rapoarte dintre un num ărător i un numitor, adic ă o secven Ńă : semn (op Ńional), întreg (num ărător), caracterul /, întreg (numitor) Reprezentarea intern ă i cea tip ărit ă este 19 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială întotdeauna a unei frac Ńii simplificate Dac ă num ărătorul e notat în alt ă baz ă decât cea zecimal ă, numitorul va fi interpretat în aceea i baz ă O frac Ńie simplificabil ă la un întreg este convertit ă automat la întreg Numitorul trebuie s ă fie diferit de zero Exemple de frac Ńii: 1/2 -2/3 4/6 (echivalent cu frac Ńia 2/3) #o243/13 (echivalent cu 163/11) Numerele reale au nota Ńia obinuită ce cuprinde punctul zecimal, semnul (op Ńional) i puterea (op Ńional) Formatul simplu sau dublu poate, de asemenea, fi specificat: 3 1415926535897932384d0 ; o aproximare în format dublu pentru 6 02E+23 ; num ărul lui Avogadro Numerele complexe sunt notate ca o secven Ńă: #c( , ), în care i sunt numere în acela i format Exemple de numere complexe: #c(1 2) ; num ărul 1 + 2*i #c(0 1) ; num ărul i #c(2/3 1 3) ; convertit intern la #c(0 6666667 1 3) Orice combina Ńie de litere i cifre poate constitui un nume de simbol În plus, oricare dintre urm ătoarele caractere poate interveni într-un nume de simbol: + - * / @ $ % ^ & = ~ 5 Printre altele, a adar, urm ătoarele iruri pot fi nume de simboluri: alpha a21 1a2 *alpha* (variabilele globale sau de sistem au, în general, nume care încep i se încheie cu asterisc) a+b a-b+c a/1 $13 1%2 a^b cel mare a=b a Orice expresie ce urmeaz ă a fi evaluată se prezintă pe un rând imediat dup ă prompter , pentru ca pe rândul urm ător s ă apară rezultatul tip ărit al evalu ării Expresiile se evalueaz ă dup ă câteva reguli simple: - un atom numeric se evalueaz ă la el însu i: 22 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială > 3 3 > 3 14 3 14 În Lisp pot fi reprezentate numere oricât de mari f ără riscul de a provoca vreo dep ăire: > 9999999999999999999999999999999999999999999999999999999 9999999999999999999999999999999999999999999999999999999 - un atom simbolic care are o valoare predefinită (în sensul asign ării sau al leg ării) se evalueaz ă la această valoare Astfel, presupunând c ă simbolului a i se asociase anterior valoarea alpha: > a alpha Excep Ńie fac simbolurile: nil care, fiind nota Ńia pentru lista vid ă cât i pentru valoarea logic ă fals, se evalueaz ă la el însu i i t care se evalueaz ă la valoare logic ă adev ărat ( true sau TRUE) Orice s-expresie diferită de nil este considerată a fi echivalentă logic cu true: > nil NIL > t TRUE - un atom simbolic care nu are o valoare predefinită dac ă este evaluat va provoca un mesaj de eroare de genul UNBOUND-VARIABLE; - o expresie simbolic ă prefixată cu apostrof ( quote) se evalueaz ă la ea îns ăi: > ’alpha alpha > ’3 3 > ’(a 3 ()) (a 3 NIL) - o listă care are pe prima poziŃie un atom recunoscut ca nume de form ă Lisp predefinită sau de func Ńie definită de utilizator se evalueaz ă astfel: forma Lisp sau func Ńia dicteaz ă maniera în care se face evaluarea urm ătoarelor elemente ale listei: care dintre acestea se evalueaz ă i care sunt lăsate neevaluate Evaluate ori nu, argumentele apelului sunt trecute apoi corpului formei sau al func Ńiei, drept parametri actuali Valoarea rezultată în urma evalu ării corpului formei sau func Ńiei cu ace ti parametri este cea care se întoarce: > (+ 2 1) 3 23 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Primul element al listei este recunoscut drept numele func Ńiei de adunare, + Parametrii adun ării rezultă prin evaluarea urm ătoarelor dou ă elemente ale listei, respectiv atomii numerici 2 i 1 Cum evaluarea îi las ă neschimba Ńi, ei sunt trecu Ńi ca atare drept parametri actuali ai adun ării Aplicarea func Ńiei + asupra lor produce rezultatul 3, care este tip ărit În Lisp, operatorii de calcul aritmetic, ca i orice alt nume de func Ńie, se noteaz ă înaintea argumentelor (nota Ńie prefixată) > (setq a ’alpha) alpha Primul element al listei este recunoscut drept forma Lisp setq Forma setq asigneaz ă argumentelor din apel de pe poziŃiile impare valorile rezultate din evaluarea argumentelor din apel de pe poziŃiile pare Astfel simbolului a i se asigneaz ă rezultatul evalu ării lui ’alpha adic ă alpha Valoarea ultimului element al listei este i valoarea întoars ă de func Ńie Forma setq constituie un exemplu de func Ńie cu efect lateral, efect ce se manifestă prin lăsarea în context a unor valori asignate unor simboluri nenumerice Forma setq este prima dintr-o serie de forme cu care ne vom întâlni mai departe i care sunt utilizate cu prec ădere pentru efectele lor laterale mai degrab ă decât pentru valorile întoarse de ele - evaluarea unei liste care are pe prima poziŃie o lambda-expresie va fi prezentată în sec Ńiunea 2 4 15 Lambda expresii; - o listă care are pe prima poziŃie un nume de macrodefiniŃie va fi prezentată în sec Ńiunea 2 6 Macro-uri; - orice altceva (ca de exemplu, o listă care are pe prima poziŃie o listă diferită de o lambda-expresie, sau un atom ce nu este cunoscut ca nume de form ă Lisp sau macro, a adar nu face parte din biblioteca de func Ńii ale Lisp-ului i nici nu este o func Ńie definită de utilizator) provoac ă, în momentul lans ării în evaluare, un mesaj de eroare de genul UNDEFINED-FUNCTION 2 4 Func Ńii i forme Lisp 2 4 1 Nota Ńii Am vorbit pân ă acum despre func Ńii i forme Lisp fără s ă preciz ăm distinc Ńia dintre ele Func Ńiile Lisp-ului îi evalueaz ă toate argumentele înainte de a le transfera corpului func Ńiei În afara func Ńiilor, prin utilizarea macro-urilor (v sec Ńiunea 2 6 Macro-uri), s-au creat forme speciale care aplic ă reguli specifice de evaluare a argumentelor Limbajul Lisp num ără o clas ă semnificativ ă de func Ńii i de forme predefinite În prezentarea func Ńiilor i a formelor vom adopta o conven Ńie de nota Ńie, care să ne permită s ă identific ăm argumentele ce se evalueaz ă fa Ńă de cele care nu se evalueaz ă, tipul acestora, rezultatul evalu ării, precum i manifestarea, atunci când va fi cazul, a efectelor laterale Aceste conven Ńii de notare sunt urm ătoarele: e – s-expresie n – atom numeric i – num ăr întreg c – num ăr complex 24 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială s – atom nenumeric (simbolic) l – listă f – func Ńională (nume sau definiŃie de func Ńie sau form ă) Dac ă un astfel de simbol, aflat pe poziŃia unui argument al unui apel de form ă Lisp, este prefixat cu un apostrof ( ’e, spre exemplu), vom în Ńelege c ă argumentul aflat pe acea poziŃie se evalueaz ă la un obiect Lisp de tipul indicat de simbol (s- expresie, în cazul exemplului de mai sus) Dimpotriv ă, dac ă el este notat fără apostrof, atunci argumentul respectiv, ce trebuie să respecte tipul indicat de simbol, nu se evalueaz ă (s ă observ ăm c ă această conven Ńie este una mnemonic ă pentru că, într-adev ăr, prin evaluarea unui obiect Lisp prefixat cu un apostrof, rămânem cu argumentul fără prefix) În plus, pentru simplificare, vom nota întotdeauna argumentele ce rezultă în urma evalu ării obiectelor prefixate cu apostrof, prin acelea i litere Astfel, dac ă ’n1,… ’nk sunt argumentele evaluabile i de tip numeric ale unui apel, vom considera, fără a mai men Ńiona acest lucru, c ă numerele ce rezultă în urma evalu ării acestora sunt notate cu n1,… nk De asemenea, vom considera de la sine în Ńeles c ă orice apel realizat cu argumente de tipuri diferite celor indicate în definiŃii duce la generarea unor mesaje de eroare Ca i mai sus, vom utiliza simbolul >>> cu semnifica Ńia „se evalueaz ă la” Astfel, în definiŃiile de func Ńii care urmeaz ă, printr-o nota Ńie e1 >>> e2 vom în Ńelege că forma Lisp e1 (o s-expresie, în acest caz) se evalueaz ă la forma e2 (de asemenea o s-expresie) Vom renun Ńa îns ă la descrierea formală a valorii întoarse în favoarea unei descrieri libere, atunci când, datorită complexităŃ ii opera Ńiilor efectuate de form ă sau func Ńie, o descriere formală ar începe s ă semene mult prea mult cu îns ăi o implementare a ei Renun Ńarea la restric Ńiile unui Lisp pur a dus inclusiv la acceptarea unui mecanism de evaluare care s ă întoarc ă mai mult decât o singură valoare Astfel, construc Ńia values din Common Lisp pune într-o structură specială valori multiple (vom vedea în sec Ńiunea 2 5 8 Valori multiple i exploatarea lor) cum pot exploatate acestea) În nota Ńia noastră vom separa prin virgule valorile multiple rezultate dintr-o evaluare: e1 >>> e2,…,en În plus, vom nota prin ~nil o valoare despre care ne intereseaz ă s ă tim c ă e diferită de nil În cazul în care evaluarea produce i efecte laterale, le vom nota dup ă o bară verticală: e1 >>> e2 | Un anumit tip de efect lateral, atribuirea unei valori unui simbol, va fi notat printr-o s ăgeată orientată stânga: se, cu semnifica Ńia: simbolul s se leag ă la valoarea e, sau simbolului s i se asigneaz ă valoarea e De asemenea, în notarea efectelor laterale, vom atribui virgulei ( ,) semnifica Ńia unui operator de execu Ńie serială i dublei linii verticale ( ‖), cea de operator de execu Ńie paralelă Cu alte cuvinte, o secven Ńă de efecte laterale E1,…,Ek va semnifica consumarea secven Ńială, în ordinea stânga-dreapta, a acestora, pe când printr-o nota Ńie E1‖ ‖Ek vom în Ńelege consumarea acelora i efecte în paralel Atunci când este important momentul evalu ării formei care produce valoarea întoars ă de apelul de func Ńie relativ la momentele producerii efectelor laterale, vom nota evaluarea formei care produce valoarea întoarsă printre efectele laterale într-o pereche de paranteze p ătrate, de exemplu: [e] 25 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Dac ă anumite efecte laterale, produse pe parcursul evalu ării unei forme, nu sunt persistente, în sensul c ă nu rămân ca observabile în contextul de evaluare a formei i dup ă terminarea evalu ării formei, atunci îndep ărtarea lor este notată explicit Astfel, îndep ărtarea efectului asign ării unei valori simbolului s va fi notată unbind(s) Pentru a descrie ac Ńiuni repetitive vom folosi structura de iterare while { } intercalată în lista efectelor laterale În prezentările apelurilor de func Ńii pot s ă apară i cuvinte cheie, care se recunosc pentru c ă sunt întotdeauna prefixate cu caracterul dou ă-puncte ( :) Într-un apel real ele trebuie reproduse ca atare Astfel de cuvinte cheie, pot fi: :test cu semnifica Ńia c ă ceea ce urmeaz ă este un test care va ac Ńiona prin valoarea T; de obicei el prefixeaz ă un nume de func Ńională, care este dat în sintaxa #’f; :test-not – prefixeaz ă un test care ac Ńioneaz ă prin valoarea NIL 2 4 2 Asignarea unei valori unui simbol Într-un limbaj imperativ, o nota Ńie de genul x:=y, unde x i y sunt variabile, este în general recunoscută ca având interpretarea: se atribuie variabilei x valoarea pe care o are variabila y S ă observ ăm îns ă c ă, în sine, o astfel de nota Ńie las ă loc la cel pu Ńin înc ă dou ă interpretări: variabila x „se leag ă” la variabila y, în Ńelegând prin aceasta c ă încât ori de câte ori y se va modifica, x se va modifica în acela i mod i variabilei x i se atribuie ca valoare însu i simbolul y Dup ă cum vom vedea, Lisp-ul face posibile toate aceste interpretări Cea mai apropiată de accep Ńiunea din limbajele imperative, „atribuirea” (sau „asignarea”) unei valori este prezentată în continuare Despre forma setq s-a vorbit deja informal în sec Ńiunea 2 3 4 (Evaluarea expresiilor Lisp) Evaluarea argumentelor de pe poziŃiile pare i, respectiv, asign ările se fac în ordine, de la stânga la dreapta: (setq s1 ’e1… sk ’ek) >>> ek|s1e1,…,sk[ek] > (setq x ’(a b c) y (cdr x)) (B C) Forma set este ca i setq numai c ă ea îi evalueaz ă toate argumentele: dac ă ’e1 >>> s1,… ’e2*k-1 >>> s2*k-1 atunci: (set ’e1 ’e2… ’e2 ’e2) >>> e2|s1e2,… s2[e2] *k-1*k*k*k-1*k > (set (car ’(x y)) ’(a b c) (car x) (cdr x)) (B C) > a (B C) Forma psetq este analog ă lui setq cu deosebirea c ă asign ările se fac în paralel: mai întâi toate formele de rang par sunt evaluate serial i apoi tuturor variabilelor (simbolurile de pe poziŃiile impare) le sunt asignate valorile corespunz ătoare: dac ă ’e1 >>> s1,… ’e2*k-1 >>> s2*k-1 atunci: (psetq ’e1 ’e2… ’e2 ’e2) >>> e2|e2,…,[e2],s1e2‖…‖ *k-1*k*k*k s2*k-1e2*k 26 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială În exemplul urm ător valorile lui x i y sunt schimbate între ele: > (setq x ‘a) A > (setq y ‘b) B > (psetq x y y x) NIL > x B > y A 2 4 3 Func Ńii pentru controlul evalu ării Am v ăzut deja c ă prefixarea unei s-expresii cu un apostrof este echivalentă apelului unei func Ńii quote A adar quote împiedic ă evaluarea: (quote e) >>> e Func Ńia eval forŃeaz ă înc ă un nivel de evaluare Astfel, dac ă: ’e1 >>> e2 i ’e2 >>> e3 , atunci: (eval ’e1) >>> e3 > (setq x 'a a 'alpha) ALPHA > (eval x) ALPHA > (eval ’(+ 1 2)) 3 2 4 4 Opera Ńii asupra listelor Construc Ńia listelor Func Ńia cons construie te o celulă din dou ă s-expresii, rezultate din evaluarea celor dou ă argumente, punându-l pe primul în jum ătatea car i pe cel de al doilea în jum ătatea cdr : (cons ’e1 ’e2) >>> (e1 e2) > (cons ’a nil) (A) > (cons ’a ’b) (A B) > (cons ’a ’(a b)) (A A B) > (cons ’alpha (cons ’beta nil)) (ALPHA BETA) Func Ńia list creeaz ă o listă din argumentele sale evaluate: (list ’e1 … ’ek) >>> (e1 (…(ek nil)…)) > (list ’a ’b ’c) (A B C) > (list ’a ’(b c)) 27 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială (A (B C)) Func Ńia append creeaz ă o listă prin copierea i punerea cap la cap a listelor ob Ńinute din evaluarea argumentelor sale Astfel, dac ă: ’l1 >>> (e11 (…(e1k1 nil)…)),…, ’ln >>> (en1 (…(enkn nil)…)) atunci: (append ’l1 … ’ln) >>> (e11 (…(e1k1 (…(en1 (…(enkn nil)…))…))…)) > (append ’(a b c) ’(alpha beta) ’(1 gamma 2)) (A B C ALPHA BETA 1 GAMMA 2) De notat c ă ultimul argument poate fi orice s-expresie, iar nu o listă cu necesitate > (setq l1 (list 'a 'b) l2 (list 'c 'd 'e) l3 'f) F > (append l1 l2 l3) (A B C D E F) Func Ńia creeaz ă celule cons noi corespunz ătoare tuturor elementelor listelor componente, cu excep Ńia celor aparŃinând ultimei liste, pe care le utilizeaz ă ca atare Accesul la elementele unei liste Func Ńiile car i cdr extrag s-expresiile aflate în poziŃiile car , respectiv cdr , ale unei celule cons Dac ă lista e vid ă car întoarce înc ă nil Dac ă ’l >>> (e1 e2), atunci: (car ’l) >>> e1 (cdr ’l) >>> e2 (car nil) >>> nil (cdr nil) >>> nil > (car ’(a b c)) A > (car ’((alpha beta) b c)) (ALPHA BETA) > (cdr ’(a b c)) (B C) > (cdr ’(a)) NIL > (cdr ’(a b)) B Prin combina Ńii car-cdr poate fi accesat orice element de pe orice nivel al unei liste Pentru simplificarea scrierii, implement ările de Lisp pun la dispoziŃie nota Ńii condensate, ca de exemplu caddar în loc de (car (cdr (cdr (car )))) Func Ńia nth selecteaz ă un element de pe o poziŃie precizată a unei liste Primul argument trebuie s ă fie un întreg nenegativ i desemneaz ă num ărul de ordine, iar al doilea – o listă, din ea urmând a se face selec Ńia Dac ă ’l >>> (e0 (…(em nil)…)) i 0£n£m, atunci: (nth ’n ’l) >>> en Dac ă n>m, atunci: (nth ’n ’l) >>> nil 28 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială > (nth 1 ’(a b c)) B > (nth 3 ’(a b c)) NIL Similar, func Ńia nthcdr efectueaz ă de un num ăr întreg i pozitiv de ori cdr asupra unei liste Dac ă l=(e0 (…(em nil)…)) i 0£n£m, atunci: (nth ’n ’l) >>> (en (…(em nil)…)) Dac ă n>m, atunci: (nth ’n ’l) >>> nil > (nthcdr 0 ’(a b c)) (A B C) > (nthcdr 1 ’(a b c)) (B C) > (nthcdr 4 ’(a b c)) NIL Func Ńia last întoarce ultima celulă cons a unei liste Dac ă l=(e1 (…(ek nil)…)), atunci: (last ’l) >>> (ek nil) (last nil) >>> nil > (last ’(a b c)) (c) > (last (cons ’a ’b)) (A B) > (last (cons ’a nil)) (A) 2 4 5 Opera Ńii cu numere Lisp-ul are o bibliotec ă foarte bogată de func Ńii aritmetice Dintre ele, prezentăm doar câteva în rândurile urm ătoare Opera Ńiile de adunare, sc ădere, înmulŃire i împ ărŃire ( k ³ 1): (+ ’n1 …’nk) >>> n1 + … + nk (- ’n) >>> -n i dac ă k > 1, atunci: (- ’n1 …’nk) >>> n1 - … - nk (* ’n1 …’nk) >>> n1 * … * nk (/ ’n1 …’nk) >>> n1 / … / nk > (+ 1 2 3) 6 > (- 5 (+ 3 3) 2) -3 > (* 1 2 3) 6 > (/ 6 3 2) 1 29 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Func Ńia / întoarce o frac Ńie (num ăr ra Ńional) dac ă argumentele ei sunt numere întregi i împ ărŃirea nu e exactă > (/ 2 3) 2/3 Această func Ńie, ca i tipul de dată num ăr ra Ńional, oferă, a adar, o cale foarte elegantă de a opera cu frac Ńii zecimale: > (+ 1 (/ 2 3)) 5/3 > (* (/ 2 3) (/ 3 2)) 1 > (+ (/ 1 3) (/ 2 5)) 11/15 Aa cum am arătat i mai sus, reprezentarea numerelor ca liste face s ă nu existe limite ce pot fi atinse u or în opera Ńiile cu acestea, de aceea apeluri ca cele de mai jos sunt posibile: > (* 99999999999999999999999999999999999999999999999999999999 8888888888888888888888888888888888888888888888888888) 888888888888888888888888888888888888888888888888888799991111111111111 111111111111111111111111111111111111112 Pentru toate func Ńiile aritmetice ac Ńioneaz ă urm ătoarea regulă de contaminare: în cazul în care argumentele unei func Ńii numerice nu sunt de acela i tip, toate sunt aduse la tipul celui mai „puternic”, conform urm ătoarei ierarhii: complex > real > ra Ńional > întreg Reguli de canonizare Un ra Ńional cu numitor 1 e considerat întreg, un real cu 0 dup ă virgulă e considerat întreg, un complex cu partea imaginară 0 e considerat real > (+ (/ 1 3) (/ 2 0 5)) 0 73333335 Toate opera Ńiile de mai sus se aplic ă i asupra argumentelor numere complexe: > (+ #c(1 2) #c(3 2)) #c(4 4) > (- #c(1 2) #c(3 2)) -2 > (* #c(1 2) #c(3 2)) #c(-1 8) > (/ #c(1 2) #c(3 2)) #c(7/13 4/13) 30 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Există mai multe func Ńii de rotunjire a unei valori Func Ńiile floor i ceiling rotunjesc o valoare în jos, respectiv în sus Dac ă n este întreg, real sau zecimal i m£n >> m, n - m (ceiling ’n) >>> m + 1, n – (m + 1) > (floor 2) 2 0 > (floor 2 9) 2 0 9000001 > (floor 2/3) 0 2/3 > (ceiling 2) 2 0 > (ceiling 2 9) 3 -0 099999905 > (ceiling 2/3) 1 -1/3 Dac ă apelurile se efectueaz ă cu dou ă argumente întregi se ob Ńine calculul câtului i al restului (comportamentul unei func Ńii care calculeaz ă modulo) Astfel, dac ă c este cel mai mic întreg pozitiv i r este un întreg pozitiv astfel încât n1= c * n2 + r, atunci: (floor ’n1 ’n2) >>> c, r (ceiling ’n1 ’n2) >>> c + 1, -r >(floor 7 3) 2 1 >(ceiling 7 3) 3 -2 Există dou ă forme Lisp de incrementare, respectiv, decrementare, fără efecte laterale: func Ńiile 1+, respectiv 1-: (1+ ’n) >>> n + 1 (1- ’n) >>> n - 1 > (setq x 1) 1 > (1+ x) 2 > x 1 > (1- x) 0 > x 1 31 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Dup ă cum se observ ă, func Ńiile nu afecteaz ă argumentele Macro-urile incf i decf fac acela i lucru, dar afecteaz ă argumentele: (incf ’n) >>> n + 1 | n n + 1 (decf ’n) >>> n - 1 | n n - 1 > (setq x 1) 1 > (incf x) 2 > x 2 > (decf x) 1 > x 1 Dac ă în apel apare i un al doilea argument, el e considerat incrementul, respectiv decrementul: (incf ’n1 ’n2) >>> n1 + n2 | n1 n1 + n2 (decf ’n1 ’n2) >>> n1 - n2 | n1 n1 - n2 > (setq x 1) 1 > (incf x 2) 3 > x 3 > (decf x 4) -1 > x -1 De notat c ă argumentele func Ńiilor 1+, 1-, incf i decf pot fi orice fel de num ăr, inclusiv complex În acest din urm ă caz incrementarea, respectiv, decrementarea se aplic ă numai p ărŃii reale Calculul valorii absolute: dac ă n³0, atunci: (abs ’n) >>> n Dac ă n >> -n > (abs (- 3 5)) 2 Dac ă argumentul este num ăr complex, rezultatul este modulul, considerat ca num ăr real > (abs #c(3 -4)) 5 0 Func Ńiile max i min calculeaz ă maximumul i minimumul unor iruri de numere Dac ă n=max(n1,… nk), atunci: 32 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială (max ’n1 … ’nk) >>> n Dac ă n=min(n1,… nk), atunci: (min ’n1 … ’nk) >>> n Aritmetica numerelor complexe În afara opera Ńiilor uzuale cu numere, ce se răsfrâng i asupra numerelor complexe ( *, -, *, /, 1+, 1-, incf, decf, abs), urm ătoarele func Ńii acceptă ca argumente numai numere complexe: conjugate, realpart, imagpart Dac ă ’c >>> #c(n1 n2), atunci: (conjugate ’c) >>> #c(n1 -n2) (realpart ’c) >>> n1 (imagpart ’c) >>> n2 Func Ńia complex compune un num ăr complex dintr-o parte reală i una imaginară: (complex ’n1 ’n2) >>> #c(n1 n2) > (conjugate (complex 1 2)) #c(1 -2) > (realpart (complex 2 3)) 2 > (imagpart (complex 2 3)) 3 2 4 6 Predicate Predicatele sunt func Ńii care întorc valori de adev ăr Multe dintre ele verific ă tipuri i rela Ńii Dac ă e este un atom, atunci: (atom ’e) >>> t altfel: (atom ’e) >>> nil Dac ă e este un atom simbolic, atunci: (symbolp ’e) >>> t altfel: (symbolp ’e) >>> nil Dac ă e este num ăr, atunci: (numberp ’e) >>> t altfel: (numberp ’e) >>> nil Dac ă e este num ăr întreg, atunci: (integerp ’e) >>> t altfel: (integerp ’e) >>> nil Dac ă e este num ăr real, atunci: 33 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială (floatp ’e) >>> t altfel: (floatp ’e) >>> nil Dac ă n este num ăr întreg par, atunci: (evenp ’n) >>> t altfel: (evenp ’n) >>> nil Dac ă n este num ăr întreg impar, atunci: (oddp ’n) >>> t altfel: (oddp ’n) >>> nil Dac ă n este num ăr i n³0, atunci: (plusp ’n) >>> t altfel: (plusp ’n) >>> nil Dac ă n este num ăr i n£0, atunci: (minusp ’n) >>> t altfel: (minusp ’n) >>> nil Dac ă n=0, atunci: (zerop ’n) >>> t altfel: (zerop ’n) >>> nil Dac ă n1= … =nk, atunci: (= ’n1 … ’nk) >>> t altfel: (= ’n1 … ’nk) >>> nil Dac ă n1 >> t altfel: ( >> nil Dac ă n1> … >nk, atunci: (> ’n1 … ’nk) >>> t altfel: (> ’n1 … ’nk) >>> nil Dac ă n1£ … £nk, atunci: ( >> t altfel: ( >> nil 34 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Dac ă n1³ … ³nk, atunci: (>= ’n1 … ’nk) >>> t altfel: (>= ’n1 … ’nk) >>> nil Dac ă ’e >>> s i s este un simbol legat, atunci: (boundp ’e) >>> t altfel: (boundp ’e) >>> nil > (setq x ’y y ’z) Z > (boundp ’x) T > (boundp x) T > (boundp ’y) T > (boundp y) NIL Dac ă e1 i e2 sunt izomorfe structural (de i pot fi obiecte Lisp distincte) atunci: (equal ’e1 ’e2) >>> t altfel: (equal ’e1 ’e2) >>> nil > (equal ’alpha ’alpha) T > (equal ’(a b c) (cons ’a (cons ’b (cons ’c nil)))) T > (equal ’(a b c) (cons ’a (cons ’b ’c))) NIL > (setq x ’(a b c) y (cdr x)) (B C) >(equal y ’(b c)) T >(equal (cdr x) y) T Dac ă e1 i e2 reprezintă aceea i structură (obiect) Lisp, cu alte cuvinte, dac ă ele adreseaz ă elemente aflate la aceea i adres ă în memorie, atunci: (eq ’e1 ’e2) >>> t altfel: (eq ’e1 ’e2) >>> nil > (eq ’alpha ’alpha) T În Common Lisp simbolurile sunt reprezentate cu unicitate Acest lucru face ca apelul de mai sus se evalueze la T Standardul nu oblig ă îns ă reprezentarea cu 35 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială unicitate a numerelor i nici a irurilor de caractere Din acest motiv nu poate fi garantat un rezultat pozitiv în cazul testării cu eq a dou ă numere egale sau a dou ă iruri de caractere identice i, ca urmare, astfel de opera Ńii trebuie evitate: > (eq 1 1) ??? > (eq "alpha" "alpha") ??? > (eq ’(a b c) (cons ’a (cons ’b (cons ’c nil)))) NIL > (setq x ’(a b c) y (cdr x)) (B C) > (eq (cdr x) ’(b c)) NIL > (eq (cdr x) y) T Predicatul eql func Ńioneaz ă la fel ca i eq, cu excep Ńia faptului c ă el întoarce T inclusiv pentru numere egale, deci obiecte care sunt i „conceptual”, iar nu numai strict implementa Ńional, identice În privin Ńa listelor i a irurilor de caractere eq i eql se comportă la fel > (eql 1 1) T Dac ă e=nil atunci: (null ’e) >>> t altfel: (null ’e) >>> nil 2 4 7 Liste privite ca mulŃimi Func Ńia member verific ă existen Ńa unei s-expresii într-o listă Dac ă ’l >>> (e1 (…(ek (…(en nil)…))…)), unde ek este prima apariŃie a acestei s- expresii în lista l care satisface (f e ek) >>> t, cu f o func Ńională ce necesită exact doi parametri, atunci: (member ’e ’l :test #’f) >>> (ek (…(en nil)…)) Implicit, Common Lisp consideră func Ńionala de test ca fiind eql Când se dore te utilizarea acesteia în test, ea poate fi ignorată: (member ’ek ’l) >>> (ek (…(en nil)…)) > (member ’alpha ’(a alpha b alpha)) (ALPHA B ALPHA) > (member 3 '(1 2 3 4 5) :test #' (member 3 '(1 2 3 4 5) :test #'evenp) Error: EVENP got 2 args, wanted 1 arg > (member '(3 4) '(1 2 (3 4) 5)) NIL > (member '(3 4) '(1 2 (3 4) 5) :test #'equal) ((3 4) 5) 36 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială > (setq x '(1 2 (3 4) 5)) (1 2 (3 4) 5) > (member (caddr x) x) ((3 4) 5) Func Ńiile union i intersection realizeaz ă reuniunea, respectiv intersec Ńia, a dou ă liste, ca opera Ńii cu mulŃimi, în sensul excluderii elementelor identice Testarea identităŃ ii, ca i în cazul func Ńiei member, este lăsată la latitudinea programatorului Testarea trebuie realizată cu o func Ńie binară anun Ńată de cuvântul cheie :test Dac ă lipse te, testul de identitate se face implicit cu eql Ordinea elementelor în lista finală este neprecizată Numai forma apelului este dată mai jos: (union ’l1 ’l2 :test #’f) (intersect ’l1 ’l2 :test #’f) > (union '(a b c d) '(1 a 2 b 3)) (D C 1 A 2 B 3) > (intersection '(a b c d) '(1 a 2 b 3)) (B A) Testul excluderii poate las ă incertă provenien Ńa elementelor ce se copiaz ă în lista finală > (union '((a 1) (b 2) (c 3) (d 4)) '((a alpha) (c gamma) (e epsilon)) :test #'(lambda(x y) (eql (car x) (car y)))) ((D 4) (B 2) (A ALPHA) (C GAMMA) (E EPSILON)) > (intersection '((a 1) (b 2) (c 3) (d 4)) '((a alpha) (c gamma) (e epsilon)) :test #'(lambda(x y) (eql (car x) (car y)))) ((C 3) (A 1)) În aceste exemple testul excluderii verific ă identitatea elementelor de pe poziŃia car a listelor-perechi-de-elemente ce intră în componen Ńa argumentelor originale Perechile de elemente (a 1) i (a alpha), respectiv (c 3) i (c gamma) răspund pozitiv la test Provenien Ńa elementelor selectate în lista-mulŃime finală, în cazul lor, e nedecidabilă Func Ńionala lambda, utilizată în aceste exemple, este tratată în sec Ńiunea 2 4 15 Lambda expresii 2 4 8 Opera Ńii logice i evalu ări controlate Operatorii logici în Lisp sunt and, or i not Dintre ace tia and i or, pentru că îi evalueaz ă argumentele în mod condiŃionat, sunt considera Ńi i structuri de control Func Ńia not are acela i comportament ca i null Dac ă e >>> nil, atunci: (not ’e) >>> t altfel: (not ’e) >>> nil Macro-ul and prime te un num ăr oarecare n³1 de argumente pe care le evalueaz ă de la stânga la dreapta pân ă când unul din ele întoarce nil, caz în care evaluarea se opre te i valoarea întoars ă este nil Dac ă, nici unul dintre primele n-1 de argumente nu se evalueaz ă la nil, atunci and întoarce valoarea ultimului argument Dac ă ’e1 >>> nil, atunci: 37 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială (and ’e1 e2 … en) >>> nil altfel, dac ă ’e2 >>> nil, atunci: (and ’e1 ’e2 … en) >>> nil a m d , altfel: (and ’e1 ’e2 … ’en) >>> en > (setq n 7) 7 > (and (not (zerop n)) (/ 1 n)) 1/7 > (setq n 0) 0 > (and (not (zerop n)) (/ 1 n)) NIL Macro-ul or prime te un num ăr oarecare n³1 de argumente pe care le evalueaz ă de la stânga la dreapta pân ă când unul din ele întoarce o valoare diferită de nil, caz în care evaluarea se opre te i valoarea acelui argument este i cea întoars ă de or Dac ă, toate primele n-1 de argumente se evalueaz ă la nil, atunci or întoarce valoarea ultimului argument Dac ă ’e1 >>> ~nil, atunci: (or ’e1 e2 … en) >>> e1 altfel, dac ă ’e2 >>> ~nil, atunci: (or ’e1 ’e2 … en) >>> e2 a m d , altfel: (or ’e1 ’e2… ’en) >>> en > (setq n 7) 7 > (or (not (zerop n)) (/ 1 n)) T > (setq n 0) 0 > (or (not (zerop n)) (/ 1 n)) Error: Attempt to divide 1 by zero 2 4 9 Forme pentru controlul evalu ării Cele mai utilizate forme Lisp pentru controlul explicit al evalu ării sunt if i cond Forma if poate fi chemată cu doi sau trei parametri În varianta cu trei parametri, evaluarea ei se face astfel: dac ă ’e1 >>> ~nil, atunci: (if ’e1 ’e2 e3) >>> e2 altfel: (if ’e1 e2 ’e3) >>> e3 În varianta cu doi parametri, dac ă: ’e1 >>> ~nil, atunci: (if ’e1 ’e2) >>> e2 altfel: (if ’e1 e2) >>> nil > (if (zerop (setq x 0)) "eroare" (/ 1 x)) "eroare" > (if (zerop (setq x 2)) "eroare" (/ 1 x)) 38 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială 1/2 cond este cea mai utilizată form ă de control a evalu ării Sintactic, ea este formată dintr-un num ăr de clauze Elementele de pe prima poziŃia a clauzelor se evalueaz ă în secven Ńă pân ă la primul care e diferit de nil În acest moment celelalte elemente ale clauzei de evalueaz ă i cond întoarce valoarea ultimului element din clauz ă Dac ă toate elementele de pe prima poziŃie din clauze se evalueaz ă la nil, atunci cond însu i întoarce nil Dac ă ’e11 >>> ~nil, atunci: (cond (’e1 … ’e11) … (ek … ekk)) >>> e11 1n1nn a m d , altfel dac ă ’ek >>> ~nil, atunci: 1 (cond (’e1 … e11) … (’ek … ’ekk)) >>> ekk 1n1nn altfel: (cond (’e1 … e11) … (’ek … ekk)) >>> nil 1n1n > (cond ((setq x t) "unu") ((setq x t) "doi") (t "trei")) "unu" > (cond ((setq x nil) "unu") ((setq x t) "doi") (t "trei")) "doi" > (cond ((setq x nil) "unu") ((setq x nil) "doi") (t "trei")) "trei" Cu toată simplitatea ei, forma if are un dezavantaj, i anume faptul c ă nu permite evaluarea a mai mult decât o singură expresie înainte de ie ire Solu Ńia o dau formele when i unless Astfel, dac ă ’e1 >>> ~nil, atunci: (when ’e1 ’e2 … ’en) >>> en|e2,…,[en] altfel: (when ’e1 e2 … en) >>> nil Similar, dac ă ’e1 >>> nil, atunci: (unless ’e1 ’e2 … ’en) >>> en|e2,…,[en] altfel: (unless ’e1 e2 … en) >>> nil 2 4 10 Liste i tabele de asocia Ńie Listele de asocia Ńie sunt structuri frecvent folosite în Lisp pentru accesul rapid la o dată prin intermediul unei chei Elementele unei liste de asocia Ńie sunt celule cons în care p ărŃile aflate în car se numesc chei i cele aflate în cdr – date Pentru că introducerea i extragerea noilor elemente, de regulă, se face printr-un cap ăt al listei, ele pot fi făcute s ă aib ă un comportament analog stivelor Într-o astfel de structură, introducerea unei noi perechi cheie-dată cu o cheie identic ă uneia deja existentă are semnifica Ńia „umbririi” asocia Ńiei vechi, dup ă cum eliminarea ei poate să însemne revenirea „în istorie” la asocia Ńia anterioară Pe acest comportament se bazeaz ă, de exemplu, „legarea” variabilelor la valori Func Ńia acons construiete o nou ă listă de asocia Ńie copiind o listă veche i ad ăugând o nou ă pereche de asocia Ńie pe prima poziŃie a acesteia Ea nu modific ă lista de asocia Ńie Dac ă ’l >>> ((e1 e2) (…((e1 e2) nil)…)), atunci: 11nn (acons ’e1 ’e2 ’l) >>> ((e1 e2) ((e1 e2) (…((e1 e2) nil)…))) 11nn 39 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială > (setq la (acons 'a 1 nil)) ((A 1)) > (acons 'b 2 la) ((B 2) (A 1)) > (acons 'a 3 la) ((A 3) (A 1)) Func Ńia pairlis organizeaz ă o listă de asocia Ńie din chei aflate într-o listă i date aflate în alta Nu există o ordine a-prioric ă de introducere a elementelor în lista de asocia Ńie Evident, cele dou ă liste-argument trebuie s ă aib ă aceea i lungime Dac ă ’l1 >>> (e11 (…(e1n nil)…) i ’l2 >>> (e21 (…(e2n nil)…), atunci: (pairlis ’l1 ’l2) >>> ((e11 e21) (…((e1n e2n) nil)…)) > (pairlis (list ’a ’b ’c) (list 1 2 3)) ((C 3) (B 2) (A 1)) Dac ă apare i un al treilea argument, care trebuie s ă fie o listă de asocia Ńie, introducerea noilor elemente se face în fa Ńa celor deja existente în această listă Func Ńiile asooc i rassoc sunt func Ńii de acces într-o listă de asocia Ńie – assoc folosind cheia pentru identificarea elementului căutat, iar rassoc – data Dac ă: ’l >>> ((e11 e21) (…((e1k e2k) (…((e1n e2n) nil)…))…)), i (e1 e2) este prima pereche cheie-dată din lista de asocia Ńie în care apare e1 pe kkk poziŃia cheii, atunci: (assoc ’e1 ’l) >>> (e1 e2) kkk Pentru aceea i listă de asocia Ńie, dac ă (e1 e2) este prima pereche cheie- kk dată din lista de asocia Ńie în care apare e2k pe poziŃia datei, atunci: (rassoc ’e2 ’l) >>> (e1 e2) kkk > (setq vals (pairlis (list 'a 'b 'a) (list 1 2 3))) ((A 3) (B 2) (A 1)) > (assoc 'a vals) (A 3) > (rassoc 1 vals) (A 1) În mod implicit, testul de identificare a cheii sau a datei, se face cu func Ńia eql Dac ă îns ă se dore te un alt tip de identificare, atunci o func Ńională (care trebuie să aib ă exact doi parametri) poate fi anun Ńată, prin cuvântul cheie :test Astfel, dac ă ’l >>> ((e11 e21) (…((e1k e2k) (…((e1n e2n) nil)…))…)) i e1k este prima apariŃie pe poziŃia cheii care satisface (f ’e e1) >>> t, cu f o func Ńională care necesită k exact doi parametri, atunci: (assoc ’e ’l :test #’f) >>> (e1 e2) kk În acelea i condiŃii pentru argumentul ’l, dar cu func Ńionala satisfăcând (f ’e e2k) >>> t: (rassoc ’e ’l :test #’f) >>> (e1k e2k) > (rassoc 2 vals :test #'>) (A 1) 40 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Exemplul probeaz ă i ordinea în care se transmit argumentele func Ńionalei: ca prim argument al func Ńionalei este considerat primul argument al func Ńiei assoc sau rassoc, iar ca cel de al doilea argument – pe rând câte o cheie, respectiv, o dată din lista de asocia Ńie 2 4 11 Loca Ńii i accese la loca Ńii Forma setf acceseaz ă o loca Ńie, pentru completarea ei prin intermediul unei func Ńionale care, în mod uzual, solicită o valoare depozitată în acea loca Ńie setf, aadar, inverseaz ă comportamentul func Ńionalei pe care o prime te ca prim argument, care, în loc de a extrage o valoare deja depozitată într-o loca Ńie, va deschide calea pentru a se memora acolo o valoare Dac ă ’f1 >>> ea, … , ’fn >>> ez atunci: (setf ’f1 ’e1 … ’fn ’en) >>> en|’f1 >>> e1, … , ’fn >>> en > (setq l '(a b c)) (A B C) > (setf (car l) 1 (cadr l) 'beta) BETA > l (1 BETA C) Oricare dintre urm ătoarele func Ńionale poate fi utilizată ca prim argument: toate func Ńiile c r, nth Alte func Ńionale vor fi ad ăugate la această listă pe măsură ce vor fi introduse 2 4 12 Lista de proprietăŃ i a unui simbol Unui simbol i se poate asocia o listă de perechi proprietate-valoare, în care proprietăŃ ile sunt simboluri, iar valorile – date Lisp În această listă o proprietate poate s ă apară o singură dată O listă de proprietăŃ i are asem ănări cu o listă de asocia Ńie (astfel numele de proprietate corespunde cheii, iar valoarea proprietăŃ ii – datei) dar există i diferen Ńe între ele (în lista de proprietăŃ i o singură valoare poate fi atribuită unei proprietăŃ i, dar mai multe în lista de asocia Ńie, ce pot fi reg ăsite în ordinea invers ă a atribuirilor) Implementa Ńional, o listă de proprietăŃ i a unui simbol este o listă de lungime pară, în care pe poziŃiile impare sunt memorate (cu unicitate) numele proprietăŃ ilor i alături de ele, pe poziŃiile pare, – valorile acestora Cercetarea valorii unei proprietăŃ i a unui simbol se face prin func Ńia get: dac ă lista de proprietăŃ i a simbolului s este: (s1 (e1 (…(sn (en nil))…))), atunci, dac ă sk Î{s1,…,sn}: (get ’s ’sk) >>> ek altfel: (get ’s ’sk) >>> nil În cazul în care un al treilea argument e specificat, atunci el indic ă valoarea care se dore te s ă înlocuiasc ă valoarea implicit întoars ă nil atunci când proprietatea solicitată nu a fost setată: dac ă sk Ï{s1,…,sn}: (get ’s ’sk ’e) >>> e 41 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Atribuirea valorii unei proprietăŃ i a unui simbol se face printr-un apel setf în care pe poziŃia func Ńionalei se folose te get: > (setf (get 'a 'p1) 'v1) V1 > (setf (get 'a 'p2) 'v2) V2 > (get 'a 'p1) V1 > (get 'a 'p2) V2 Func Ńia remprop îndep ărteaz ă o valoare pe de o proprietate a unui simbol Astfel, dac ă lista de proprietăŃ i a simbolului s este: l=(s1 (e1 (…(sk (ek (…(sn (en nil))…)))…))), astfel încât: (get ’s ’sk) >>> ek atunci: (remprop ’s ’sk) >>> ~nil | l (s1 (e1 (…(sn (en nil))…))) Func Ńia symbol-plist întoarce lista de proprietăŃ i a unui simbol: Dac ă lista de proprietăŃ i a simbolului s este: (s1 (e1 (…(sn (en nil))…))), atunci: (symbol-plist ’s) >>> (s1 (e1 (…(sn (en nil))…))) > (setf (get 'a 'p1) 'v1) V1 > (setf (get 'a 'p2) 'v2) V2 > (symbol-plist 'a) (P2 V2 P1 V1) 2 4 13 Func Ńii chirurgicale Func Ńiile chirurgicale îi justific ă numele prin faptul c ă realizeaz ă modific ări asupra argumentele Ele sunt a adar func Ńii în care efectul lateral este cel care primeaz ă Func Ńia nconc modific ă toate argumentele (fiecare de tip listă) cu excep Ńia ultimului, realizând o listă din toate elementele listelor componente Astfel, dac ă: l1 = (e1 (…(e11 nil)…)),… ln = (en (…(enn-1 nil)…)), 1k-1-1,1-1,k ln = (en1 (…(enkn nil)…)) atunci: (nconc 'l1 … 'ln-1 'ln) >>> (e1 (…(e11 (…(en (…(enn-1 (en (…(enn nil)…)))…))…))…)) | 1k-1,1-1,k1k l1 >>> (e1 (…(e11 (…(en (…(enn nil)…)…)…) 1k1k ,… ln >>> (en (…(enn-1 (en (…(enn nil)…)))…)) -1-1,1-1,k1k Nota Ńia pune în eviden Ńă faptul c ă primele n-1 argumente, din cele n ale apelului, vor rămâne modificate în urma apelului 42 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială > (setq x '(a b c)) (A B C) > (setq y '(1 2 3)) (1 2 3) > (setq z '(u v)) (U V) > (nconc x y z) (A B C 1 2 3 U V) > X (A B C 1 2 3 U V) > y (1 2 3 U V) > z (U V) Func Ńia rplaca modific ă car -ul celulei cons ob Ńinută din evaluarea primului argument la valoarea celui de al doilea argument i întoarce celula cons modificată Dac ă: l = (e1 e2), atunci: (rplaca ’l ’e) >>> (e e2) | l = (e e2) > (setq x ‘(a b c)) (A B C) > (rplaca (cdr x) ‘d) (D C) > x (A D C) Func Ńia rplacd modific ă cdr -ul celulei cons ob Ńinută din evaluarea primului argument la valoarea celui de al doilea argument i întoarce celula cons modificată Dac ă: l = (e1 e2), atunci: (rplacd ’l ’e) >>> (e1 e) | l = (e1 e) > (setq x ‘(a b c)) (A B C) > (rplacd (cdr x) ‘d) (B D) > x (A B D) Urm ătorul exemplu probeaz ă c ă un apel append copiaz ă toate elementele listelor argument cu excep Ńia ultimului: > (setq x '(a b c) y '(d e)) (D E) > (setq z (append x y)) (A B C D E) > (rplaca x 'alpha) (ALPHA B C) > z (A B C D E) > (rplaca y 'beta) (BETA E) > z (A B C BETA E) 43 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială 2 4 14 Forme de apelare a altor func Ńii Func Ńia apply cheam ă o func Ńie asupra unei liste de argumente > (setq f '+) + > (apply f '(1 2 3)) 6 > (apply #'+ '()) 0 > (apply #'min '(2 -6 8)) -6 Func Ńia funcall aplic ă o func Ńie asupra unor argumente > (cons 1 2) (1 2) > (setq cons (symbol-function '+)) # > (funcall cons 1 2) 3 > (funcall #'max 1 2 3 4) 4 > (setq x 2) 2 > (funcall (if (> x 0) #'max #'min) 1 2 3 4) 4 > (setq x -2) -2 > (funcall (if (> x 0) #'max #'min) 1 2 3 4) 1 2 4 15 Lambda expresii O lambda-expresie ata eaz ă unui set de parametri formali un corp de func Ńie O lambda-expresie poate fi folosită în locul unui nume de func Ńie: ((lambda (s1… sk) ec1… ecn) ’ep1… ’epk) >>> ecn | s1ep1,…, skepk, ec,…, [ec], unbind(s1,…, sk) 1n Proceduri uzuale de apel sunt: ca prim argument al unei liste supus ă evalu ării, sau prin intermediul func Ńiilor apply, funcall ori map (a se vedea sec Ńiunea urm ătoare) La evaluare, mai întâi argumentele formale ale lambda- definiŃiei ( s1…sk) se leag ă la valorile actuale evaluate ( ep…ep), apoi formele 1k corpului definiŃiei ( ’ec1…’ecn) sunt evaluate una dup ă alta Valoarea întoars ă este cea rezultată din evaluarea ultimei forme Lambda-definiŃia marcheaz ă un context (domeniu) lexical (discutat în sec Ńiunea 2 5 5 Variabile i domeniile lor) pentru variabilele locale > ((lambda(x y) (> x y)) 3 2) T 44 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială 2 4 16 Lambda-func Ńii recursive6 Nu putem utiliza o lambda definiŃie pentru o func Ńie recursiv ă pentru c ă lambda-func Ńia nu are nume Pentru a asocia nume func Ńiilor definite ca lambda- expresii se folose te construc Ńia labels Forma unui apel este: (labels ( *) *) în care fiecare dintre specifica Ńiile de legare trebuie s ă aib ă forma: ( ) adic ă analog unei definiŃii lambda În interiorul expresiilor din labels, va referi acum o func Ńie ca dup ă un apel: #'(lambda ) > (labels ((inc (x) (1+ x)))(inc 3)) 4 În exemplul urm ător primul argument al lui mapcar este o func Ńie recursiv ă: > (defun count-instances (obj lsts) (labels ((instances-in (lst) (if (consp lst) (+ (if (eq (car lst) obj) 1 0) (instances-in (cdr lst))) 0))) (mapcar #'instances-in lsts))) COUNT-INSTANCES > (count-instances 'a '((a b c) (d a r p a) (d a r) (a a))) (1 2 1 2) Func Ńia prime te un obiect i o listă i întoarce o listă a num ărului de apariŃii a obiectului în fiecare element al listei > (labels((dot-product (a b) (if (or (null a)(null b)) 0 (+ (* (car a)(car b)) (dot-product (cdr a)(cdr b)))))) (dot-product '(1 2 3) '(10 20 30))) 140 Apelul de mai sus cuprinde o definiŃie recursiv ă a produsului scalar al doi vectori (da Ńi ca liste) 2 4 17 Func Ńii de coresponden Ńă Din această categorie fac parte func Ńii care aplic ă o func Ńională asupra argumentelor construite din listele primite ca parametri Func Ńiile de coresponden Ńă, 6 Exemplele din această sec Ńiune sînt preluate din (Graham, 1994) 45 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială exersate corect, formeaz ă deprinderea de a gândi transform ări aplicate unei mulŃimi de obiecte, de o manieră globală, iar nu ca iterări asupra elementelor mulŃimii Mapcar aplic ă o func Ńie asupra elementelor unor liste: dac ă ’l1 >>> (e11 (…(e1k1 nil)…)),… ’ln >>> (en1 (…(enkn nil)…)) i f este o func Ńională de n argumente (a adar aritatea func Ńionalei este egală cu num ărul listelor comunicate ca parametri) i dac ă lungimea celei mai mici liste argument este k ( k = min (k1,… , kn)), atunci: (mapcar ’f ’l1 … ’ln) = (list (funcall #’f ’e11 … ’en1) … (funcall #’f ’e1k … ’enk)) cu alte cuvinte, valoarea întoars ă de mapcar va fi o listă de lungime k, în care fiecare element de rang j ( jÎ{1,…, k}) reprezintă valoarea întoars ă de evaluarea func Ńionalei f asupra elementelor de rang j din fiecare din listele din intrare (v i Figura 2 5) > (mapcar 'equal '(a (b c) d e) '(b (b c) f e 3)) (NIL T NIL T) Urm ătorul apel realizeaz ă produsul scalar al doi vectori7 da Ńi ca liste de numere: > (apply #'+ (mapcar #'* '(1 2 3) '(10 20 30))) 140 Urm ătoarea secven Ńă inten Ńioneaz ă s ă înlocuiasc ă nume de persoane cu diminutivele lor într- un text dat: > (setq l (pairlis '(Mihai Gheorghe Nicolae Ion) '(Misu Ghita Nicu Ionica))) ((ION IONICA) (NICOLAE NICU) (GHEORGHE GHITA) (MIHAI MISU)) > (mapcar #'(lambda(x) (if (null (assoc x l)) x (cdr (assoc x l)))) '(Mihai s-a intilnit cu Mircea ca sa-l viziteze impreuna pe Ion)) (MISU S-A INTILNIT CU MIRCEA CA SA-L VIZITEZE IMPREUNA PE IONICA) 7 Produsul scalar al doi vectori de numere este numărul egal cu suma produselor elementelor de acela i rang din cei doi vectori: dac ă v1=(a1,…,an), v2=(b1,…,bn), atunci v1 v2=a1*b1 + …+ an*bn 46 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială num ărul argumentelor = ionalei aritatea func Ń (mapcar ’f ’l1 … ’ln) (f e11 … 1 ) e1 en (f e12 … 2 ) e2 endimensiunea ie irii = lungimea listei minime … … … e1 en e k(f … ) k k Figura 2 5: Evaluarea în cazul unui apel mapcar um ărul argumentelor = naritatea func Ńionalei … ’ln) (maplist #’f ’l1 (f l1 … l ) e1 n dimensiunea (cdr l1) … (cdr l)(f ) e2 n ie irii = … … … lungimea listei minime (f (cdr(…(cdr l)…) … (cdr(…(cdr l)…) ) e kn 1 Figura 2 6: Evaluarea în cazul unui apel maplist Această implementare suferă de un defect: execu Ńia este ineficientă pentru c ă asocierea unui nume într-o listă este făcută de dou ă ori Vom corecta această deficien Ńă în sec Ńiunea dedicată formei let Maplist – func Ńioneaz ă asem ănător cu mapcar, numai c ă func Ńionala este aplicată listelor i cdr -urilor succesive ale acestora, în secven Ńă: > (maplist #'(lambda (x) x) '(1 2 3 4)) ((1 2 3 4) (2 3 4) (3 4) (4)) > (mapcar #'(lambda (x) (cons 'alpha x)) (maplist #'(lambda (x) x) '(1 2 3 4))) ((ALPHA 1 2 3 4) (ALPHA 2 3 4) (ALPHA 3 4) (ALPHA 4)) > (mapcar #'(lambda (x) (apply #'+ x)) (maplist #'(lambda (x) x) '(1 2 3 4))) (10 9 7 4) 47 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială 2 5 Tehnici de programare în Lisp 2 5 1 DefiniŃii de func Ńii DefiniŃia unei func Ńii se face cu construc Ńia defun: (defun s (s1… sk) e1… en) >>> s | s (lambda(s1… sk) e1… en) Aadar, rezultatul unei definiŃii de func Ńii este crearea unei leg ări între un nume, recunoscut global, – s, o listă de variabile, considerate variabile formale ale func Ńiei, – s1… sk i un corp al func Ńiei – secven Ńa e1… ek De i neuzuală, este permis ă, desigur, definirea de func Ńii în interiorul altor func Ńii O func Ńie definită în interiorul altei func Ńii devine cunoscută sistemului îns ă numai dup ă apelarea cel pu Ńin o dată a func Ńiei în care a fost ea definită: > (defun f1 () (princ "f1")) F1 > (defun f2() (defun f3() (princ "f3")) (princ "f2")) F2 > (f1) f1 "f1" > (f2) f2 "f2" > (f3) f3 "f3" > (defun f4() (defun f5() (princ "f5")) (princ "f4")) F4 > (f5) Error: attempt to call `F5' which is an undefined function [condition type: UNDEFINED-FUNCTION] > (f4) f4 "f4" > (f5) f5 "f5" 2 5 2 Recursivitate În Lisp recursia este la ea acas ă Iată definiŃia func Ńiei factorial: > (defun fact (n) (if (zerop n) 1 (* n (fact (1- n))))) O strategie, care nu d ă gre , de definire a func Ńiilor recursive zice a a: - începe prin a scrie condiŃia de oprire; - scrie apoi apelul recursiv > (defun fact (n) (if (zerop n) 0 (* n (fact (- n 1))))) 48 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială FACT Orice argument, oricât de mare, poate fi dat acestei func Ńii: >(fact 1000) 402387260077093773543702433923003985719374864210714632543799910429938 512398629020592044208486969404800479988610197196058631666872994808558 901323829669944590997424504087073759918823627727188732519779505950995 276120874975462497043601418278094646496291056393887437886487337119181 045825783647849977012476632889835955735432513185323958463075557409114 262417474349347553428646576611667797396668820291207379143853719588249 808126867838374559731746136085379534524221586593201928090878297308431 392844403281231558611036976801357304216168747609675871348312025478589 320767169132448426236131412508780208000261683151027341827977704784635 868170164365024153691398281264810213092761244896359928705114964975419 909342221566832572080821333186116811553615836546984046708975602900950 537616475847728421889679646244945160765353408198901385442487984959953 319101723355556602139450399736280750137837615307127761926849034352625 200015888535147331611702103968175921510907788019393178114194545257223 865541461062892187960223838971476088506276862967146674697562911234082 439208160153780889893964518263243671616762179168909779911903754031274 622289988005195444414282012187361745992642956581746628302955570299024 324153181617210465832036786906117260158783520751516284225540265170483 304226143974286933061690897968482590125458327168226458066526769958652 682272807075781391858178889652208164348344825993266043367660176999612 831860788386150279465955131156552036093988180612138558600301435694527 224206344631797460594682573103790084024432438465657245014402821885252 470935190620929023136493273497565513958720559654228749774011413346962 715422845862377387538230483865688976461927383814900140767310446640259 899490222221765904339901886018566526485061799702356193897017860040811 889729918311021171229845901641921068884387121855646124960798722908519 296819372388642614839657382291123125024186649353143970137428531926649 875337218940694281434118520158014123344828015051399694290153483077644 569099073152433278288269864602789864321139083506217095002597389863554 277196742822248757586765752344220207573630569498825087968928162753848 863396909959826280956121450994871701244516461260379029309120889086942 028510640182154399457156805941872748998094254742173582401063677404595 741785160829230135358081840096996372524230560855903700624271243416909 004153690105933983835777939410970027753472000000000000000000000000000 000000000000000000000000000000000000000000000000000000000000000000000 000000000000000000000000000000000000000000000000000000000000000000000 000000000000000000000000000000000000000000000000000000000000000000000 000000000000000 > Abia un argument exagerat de mare, de genul: >(fact (fact 1000)) ne poate cauza neplăceri (atunci când interpretorul utilizat nu este unul comercial): Error: An allocation request for 1080 bytes caused a need for 2883584 more bytes of heap This request cannot be satisfied because you have hit the Allegro CL Trial heap limit [condition type: STORAGE- CONDITION] 49 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Recursivitate coad ă8 Se spune c ă o func Ńie este coad ă-recursiv ă dac ă, dup ă apelul recursiv, nu mai are nimic de făcut Urm ătoarea func Ńie e coad ă-recursiv ă: > (defun our-find-if (fn lst) (if (funcall fn (car lst) (car lst) (our-find-if fn (cdr lst)))) pentru c ă func Ńia întoarce direct valoarea apelului recursiv Urm ătoarele func Ńii nu sunt coad ă-recursiv ă: > (defun our-length (lst) (if (null lst) 0 (1+ (our-length (cdr lst))))) > (defun suma (lst) (if (null lst) 0 (+ (car lst) (suma (cdr lst))))) pentru c ă rezultatul apelului recursiv este transferat, într-un caz lui 1+ i, în celălalt caz, func Ńiei de adunare + Nici func Ńia factorial, definită mai sus, nu e coad ă- recursiv ă Recursivitatea coad ă este c ăutată pentru c ă multe compilatoare Common Lisp pot transforma func Ńii coad ă-recursive în bucle (itera Ńii) O func Ńie care nu e coad ă-recursiv ă poate adesea fi transformată într-una care e coad ă recursiv ă prin scufundarea în ea a unei alte func Ńii ce con Ńine un argument acumulator (ce păstreaz ă valoarea calculată pân ă la un moment dat) Scrierea func Ńiilor cu recursivitate coad ă prin parametru acumulator Urm ătoarea func Ńie întoarce lungimea unei liste: > (defun tail-length (lst acc) (if (null lst) acc (tail-length (cdr lst) (1+ acc)))) Func Ńia de adunare a elementelor unei liste, de mai sus, scris ă în varianta cu registru acumulator: > (defun suma1 (lst ac) (if (null lst) ac (suma1 (cdr lst) (+ ac (car lst))))) > (suma1 '(1 2 3 4 5) 0) 0 : (SUMA1 (1 2 3 4 5) 0) 1 : (SUMA1 (2 3 4 5) 1) 2 : (SUMA1 (3 4 5) 3) 3 : (SUMA1 (4 5) 6) 4 : (SUMA1 (5) 10) 8 O parte din exemplele acestei sec Ńiuni sînt preluate din (Graham, 1994) 50 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială 5 : (SUMA1 NIL 15) 5 : returned 15 4 : returned 15 3 : returned 15 2 : returned 15 1 : returned 15 0 : returned 15 15 Apelul acestei func Ńii trebuie încapsulat într-un alt apel care s ă iniŃializeze acumulatorul: > (defun suma (lst) (suma1 lst 0)) Acela i lucru poate fi îns ă realizat cu ajutorul lui labels astfel încât func Ńia recursiv ă s ă fie ascuns ă în interiorul alteia care nu afieaz ă argumentul acumulator În acest fel "buc ătăria" apelului recursiv nu se manifestă la suprafa Ńă: > (defun our-length (lst) (labels ((rec (lst acc) (if (null lst) acc (rec (cdr lst) (1+ acc))))) (rec lst 0))) 2 5 3 Forme de secven Ńiere progn este o form ă al c ărei scop este pur i simplu acela de a evalua într-o secven Ńă o succesiune de forme Lisp în vederea întoarcerii ultimei valori: (progn ’e1… ’en) >>> en | e1,…,[en] prog1 se comportă la fel ca progn, cu deosebirea c ă valoarea întoars ă este cea a primei forme din cuprinderea sa: (prog1 ’e1… ’en) >>> e1 | [e1],…,en Utilizând formele progn i prog1 se pot realiza mai multe evalu ări în contexte sintactice în care doar o singură form ă este permis ă (ca de exemplu, toate cele trei poziŃii ale argumentelor formei if) Este clar c ă rostul utiliz ării unui prog1 într-o definiŃie de func Ńie este acela de a întoarce o valoare înainte efectu ării unor evalu ări care sunt importante numai prin efectele lor laterale 2 5 4 Formele speciale let i let* Forma let oferă un mijloc de a defini variabile a c ăror semnifica Ńie s ă fie aceea i într-o anumită întindere de program Rostul ei este, a adar, de a defini domenii lexicale i de a preciza leg ări (despre domenii vom vorbi pe larg în sec Ńiunea urm ătoare) Cel mai frecvent tip de apel al formei let are forma: 51 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială (let ((s1 ’ei)…(sn ’ei)) ’ec…’ec) >>> ec | ei,…,ei, s1ei‖…‖ 1n1kk1n1 snein,ec1,…,[eck],unbind(s1,…,sn) În acest apel, s1…sn sunt variabile locale, ’ei1…’ein sunt expresii care, evaluate, configureaz ă valorile iniŃiale pe care le iau variabilele înainte de evaluarea în secven Ńă a expresiilor ’ec…’ec Valoarea întoars ă de let este cea a ultimei 1k expresii, eck DefiniŃia de mai sus caută s ă surprind ă, în sec Ńiunea de efecte laterale, secven Ńa evalu ărilor, cu prec ădere faptul c ă evaluarea secven Ńei ’ec…’ec se face 1k în contextul iniŃial al leg ărilor variabilelor s1,…,sn la valorile iniŃiale ei1,…,ein, leg ările fiind făcute în paralel dup ă ce valorile iniŃiale au fost evaluate serial Aceste leg ări sunt îns ă „uitate” la ie irea din form ă Într-adev ăr, dincolo de graniŃa acestei construc Ńii, semnifica Ńia variabilelor locale, ca i leg ările realizate, se pierd Nota Ńia noastră mai comunic ă i ideea c ă valoarea întoars ă este într-adev ăr acel ec, ob Ńinut k la un anumit moment în secven Ńa evalu ărilor, dup ă care contextul leg ărilor este uitat Legarea simultan ă a variabilelor la valori face posibilă schimbarea între ele a valorilor a dou ă variabile fără intermediul unei a treia variabile care s ă memoreze temporar valoarea uneia dintre ele: > (let ((x ’a)(y ’b)) (prin1 x) (prin1 y) (let ((x y)(y x)) (prin1 x) (prin1 y))) ABBA A Folosind forma let putem eficientiza solu Ńia exerciŃiului cu diminutive dat mai sus: > (mapcar #'(lambda(x) (let ((temp (assoc x l))) (if (null temp) x (cdr temp)))) '(Mihai s-a intilnit cu Mircea ca sa-l viziteze impreuna pe Ion)) (MISU S-A INTILNIT CU MIRCEA CA SA-L VIZITEZE IMPREUNA PE IONICA) Forma let* este similară formei let, cu deosebirea c ă legarea variabilelor la valori este făcută serial Cel mai frecvent tip de apel al formei let* are forma: (let* ((s1 ’ei1)… (sn ’ein)) ’ec1…’eck) >>> eck | ei1,s1ei1, …, ei,snei,ec,…,[ec],unbind(s1),…,unbind(sn) nn1k Desigur, cu let* rezultatul permutării de valori de mai sus nu se mai p ăstreaz ă: > (let ((x ’a)(y ’b)) (prin1 x) (prin1 y) (let* ((x y)(y x)) (prin1 x) (prin1 y))) ABBB B Exemplele care urmeaz ă pun în eviden Ńă diverse domenii create cu let i let*: > (let ((x 1)) (prin1 x) (let ((x 2)(y x)) (prin1 x)(prin1 y)) 52 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială (prin1 x)) 1211 1 > (let ((x 1)) (prin1 x) (let* ((x 2)(y x)) (prin1 x)(prin1 y)) (prin1 x)) 1221 1 2 5 5 Variabile i domeniile lor În Lisp no Ńiunea de variabilă, atât de comun ă în alte limbaje de programare, în Ńeleas ă ca asocierea dintre un nume simbolic, un tip i un spa Ńiu de memorie unde poate fi depozitată o valoare, trebuie privită oarecum diferit Vom continua s ă numit variabilă un simbol care apare în codul programului cu intenŃia ca lui s ă i se asocieze valori Mai întâi, a a cum am arătat deja (v sec Ńiunea 2 3 Tipuri de date în Lisp), variabilele nu au tipuri Apoi, nu este cazul ca o variabilă s ă defineasc ă un spa Ńiu de memorie care s ă fie ocupat de o valoare Aici, simbolului care d ă numele variabilei i se poate asocia o valoare Un num ăr de fome ale Lisp-ului (printre ele: defun, lambda, let, let*, do, dolist, dotimes etc , adic ă acele forme ce permit definirea de parametri locali) creeaz ă domenii (sau întinderi) ale variabilelor ce apar pe post de parametri locali în aceste forme Un domeniu este un spa Ńiu lexical contiguu, m ărginit de perechea de paranteze care „îmbrac ă” o form ă, ce eviden Ńiaz ă o listă de parametri locali La orice moment func Ńioneaz ă urm ătoarea regulă de legare: valoarea unei variabile este dictată de ultima legare ce a avut loc în cel mai adânc domeniu care cuprinde variabila în lista de parametri locali ai s ăi Dac ă nu există nici un domeniu care s ă numere variabila printre parametrii s ăi atunci variabila e considerată globală i legarea se face în domeniul de adâncime zero, cel al expresiilor evaluate la prompter Astfel, în Figura 2 7 sunt schiŃate trei domenii, în afara celui global (considerat de adâncime zero): cel exterior (sau de adâncime unu), notat cu A, care define te ca locale variabilele x, u i w, i dou ă domenii de adâncime doi, notate B i respectiv C, care au ca variabile locale, B pe x i y ,iar C pe x, z i u În contextul domeniului B valorile variabilelor referite sunt: pentru x i y – cele legate în acest context, pentru u – cea legată în contextul A i pentru z – cea definită în contextul global În contextul domeniului A, în continuare sunt referite variabilele: x – cu valoarea legată în contextul A i v – cu valoare globală În sfârit, în domeniul C sunt referite variabilele: x, z i u – cu valorile date de leg ările domeniului C, i w – cu legarea din contextul domeniului A O variabilă care nu este definită ca locală într-un domeniu se spune c ă este liberă în acel domeniu Astfel, de exemplu, domeniul A con Ńine variabila liberă v, domeniul B – variabilele u i y, iar domeniul C – variabila w (x,u,w) (x,y) x,y,u,z x,v (x,z,u) x,z,u,w B C A Figura 2 7: Domenii lexicale incluse 53 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Teoretic, există dou ă modalităŃi prin care putem s ă asociem o valoare unei variabile ce nu este parametru local al unei func Ńii: prin legare static ă i prin legare dinamic ă În legarea static ă, valoarea unei astfel de variabile este stabilită de contextul lexical (întinderea de program) în care este ea folosită, pe când în legarea dinamic ă atribuirea valorii rezultă în urma execu Ńiei O valoare a unei variabile legată lexical poate fi referită numai de forme ce apar textual în interiorul construc Ńiei ce a produs legarea O astfel de legare impune a adar o limitare spa Ńială, iar nu una temporală, a domeniului unde referin Ńa se poate realiza în siguran Ńă Dimpotriv ă, o valoare a unei variabile legată dinamic poate fi referită în siguran Ńă în toate momentele ulterioare leg ării pe parcursul evalu ării formei în care a fost efectuată legarea Ca urmare ea impune o limitare temporală asupra apariŃiei referin Ńelor iar nu una spa Ńială Tipul de legare considerat implicit în Common Lisp este cea static ă, de i nu întotdeauna lucrurile au stat a a Într-adev ăr în multe implementări anterioare ale Lisp-ului (ca de exemplu, realiz ările române ti DM-LISP (Giumale et al , 1987) i TC-LISP (Tufi, 1987) (Tufi, Popescu, 1987)) se optase pentru o legare dinamică Legarea static ă este o trăsătură a majorităŃ ii limbajelor moderne i ea asigură o mai mare rezisten Ńă la erori programelor O strategie de legare în care valorile atribuite variabilelor s ă depind ă de firul curent al execu Ńiei a constituit, la un moment dat, o alternativ ă de implementare atrăgătoare, din cauza posibilităŃ ilor mai bogate, aproape exotice, de comunicare a valorilor variabilelor în timpul execu Ńiei, pe care această op Ńiune le oferea Experien Ńa a arătat îns ă c ă un astfel de comportament predispunea la erori i, ca urmare, standardul Common Lisp, fără a-l invalida, nu îl recomand ă El poate fi ales explicit de utilizator printr-o declara Ńie special (v cap 9 Declarations în (Steele, 1990)) > (defun F1() (let ((x 'a)) (defun F2() (prin1 x) ) ) ) F1 > (F1) F2 > (let ((x 'b))(F2)) A A Exemplul dore te s ă eviden Ńieze cele dou ă posibilităŃ i de legare ale variabilei x DefiniŃia func Ńiei F1 cuprinde o legare a simbolului x la valoarea a urmată de o definiŃie a func Ńiei F2, în care valoarea lui x este tip ărită Corpul definiŃiei func Ńiei F2 creeaz ă un domeniu pentru x În F2 variabila x nu este parametru formal i deci aici nu avem un nou domeniu pentru x DefiniŃia func Ńiei F2 are loc odată efectuat apelul lui F1 Mai departe are loc apelul lui F2 într-un context în care x este legată la valoarea b (domeniu precizat de forma let, ce va fi prezentată în sec Ńiunea urm ătoare) Un comportament tipic leg ării dinamice ar trebui s ă produc ă tip ărirea valorii B, pentru c ă simbolul x era legat la această valoare înainte de apelul func Ńiei F2 în care are loc tip ărirea Faptul c ă valoarea tip ărită este îns ă A semnaleaz ă un 54 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială comportament tipic leg ării statice, adic ă unul în care simbolul x din contextul formei let este „altul” decât cel din corpul definiŃiei lui F2 Pentru alt exemplu v i (Graham, 1994), p 16 2 5 6 Leg ări versus asign ări Chestiunile discutate pân ă acum probeaz ă c ă există dou ă maniere în care o variabilă poate c ăpăta o valoare: prin legare (exemplu: let) i prin asignare (exemplu: setq) Orice construc Ńie care leag ă o variabilă la o nou ă valoare salveaz ă vechea valoare, dac ă noul domeniu este inclus într-unul vechi, astfel încât la ie irea din construc Ńia care a produs noua legare variabila revine la vechea valoare Exemplul urm ător lămure te: > (let ((x 'a)) (prin1 x) (let ((x 'b)) (prin1 x)) (prin1 x)) ABA A > (let ((x 'a)) (prin1 x) (let () (setq x 'b) (prin1 x)) (prin1 x)) ABB B > (let ((x 'a)) (prin1 x) (let ((x 'b)) (setq x 'c) (prin1 x)) (prin1 x)) ACA A În primul exemplu, avem dou ă domenii incluse unul în altul, pentru variabila x În domeniul exterior x se leag ă la valoarea A, la intrarea în domeniul interior x se leag ă la valoarea B, iar la ie irea din acesta revine la vechea valoare – B În exemplul al doilea, x este liber în domeniul interior, dar îi este asignată acolo valoarea B La ie irea din acest domeniu, care nu este al s ău, e normal ca x să p ăstreze această valoare În al treilea exemplu, x este legat din nou în ambele domenii i, ulterior leg ării interioare la valoarea B, îi este asignată o a treia valoare – C La revenirea în domeniul exterior, x recap ătă valoarea la care era legat acolo – A Valoarea pe care o poate avea o variabilă când nu s-a realizat nici o legare explicită a ei se consideră globală O valoare globală poate fi dată numai prin asignare DefiniŃie Un simbol s apare liber într-o expresie când e folosit ca variabilă în acea expresie dar expresia nu creeaz ă o legare pentru el Astfel, în exemplul urm ător, w, x i z apar libere în list iar w i y apar libere în let: (let ((x y) (z 10)) (list w x z)) Despre o variabilă care este liberă într-un domeniu, precum i în toate domeniile care-l înglobeaz ă pe acesta, i care nu are asignată o valoare în domeniul global vom spune c ă e nelegată ( unbound) În sec Ńiunea 2 4 2 Asignarea unei valori unui simbol discutam modalităŃ i diferite de interpretare a unei nota Ńii de genul x:=y Aparent cea mai simplă, prima interpretare discutată este în realitate cea mai subtilă: ea dorea ca variabila x s ă primeasc ă valoarea pe care o are variabila y, dup ă care ele s ă aib ă „vie Ńi” separate, 55 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială în sensul c ă orice modific ări efectuate asupra uneia s ă nu se resfrâng ă i asupra celeilalte S ă observ ăm c ă nici asignarea simplă, de genul (setq x y), i nici legarea, de genul (let* ((y )(x y)) ) nu realizează acest deziderat pentru c ă există pericolul ca modific ările asupra uneia dintre variabile s ă fie rezultatul interven Ńiei unei func Ńii chirurgicale (v sec Ńiunea 2 4 13 Func Ńii chirurgicale), caz în care ea ar fi resim Ńită de ambele variabile Am avea a adar cel de al doilea comportament comentat, care este unul în care cele dou ă variabile devin „surori siameze” Pentru a realiza primul efect este necesară copierea valorii simbolului y ca valoare a lui x Common-Lisp dispune de mai multe func Ńii de copiere Astfel dac ă y este o listă, putem scrie: (setq x (copy-list y)) În ultima interpretare variabilei x i se atribuie ca valoare însu i simbolul y: (setq x ’y) 2 5 7 Forme de iterare dolist itereaz ă acelea i evalu ări asupra tuturor elementelor unei liste Dac ă l = (e1 (…(ek nil)…)), atunci: (dolist (s ’l ’e) ’ec1… ’ecn) >>> e | s e1,ec1,…,ecn,…,sek, ec,…,ec,[e],unbind(s) 1n > (dolist (x '(a b c d) 'exit) (prin1 x) (princ " ") ) A B C D EXIT Într-o altă form ă a apelului, valoarea întoars ă poate fi ignorată: (dolist (s ’l) ’ec… ’ec) >>> nil | s e1,ec,…,ec,…,sek, 1n1n ec1,…,ecn,[nil],unbind(s) dotimes itereaz ă acelea i evalu ări de un num ăr anumit de ori: Dac ă n>0, atunci: (dotimes (s ’n ’e) ’ec1…’ecn) >>> e | s 0,ec1,…,ecn,…, sn-1,ec1,…,ecn,sn,[e],unbind(s) > (dotimes (x 4 x) (prin1 x) (princ " ") ) 0 1 2 3 4 NIL Într-o altă form ă a apelului, valoarea întoars ă poate fi ignorată: 56 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială (dotimes (s ’n) ’ec1…’ecn) >>> nil | s 0,ec1,…,ecn,…, sn-1,ec1,…,ecn,[nil],unbind(s) Forma do reprezintă maniera cea mai generală de a organiza o itera Ńie în Lisp Ea permite utilizarea unui num ăr oarecare de variabile i controlarea valorilor lor de la un pas al itera Ńiei la urm ătorul Forma cea mai complex ă a unui apel do este: (do ((s1 ’ei1 ’es1)… (sn ’ein ’esn)) (’et ’er1… ’erp) ’ec1… ’ecq) >>> erp | ei1,…,ein,s1ei1‖…‖ snein, while(not et) {ec1,…,ecq,es1,…,esn,s1es1‖…‖ snesn},er1,…,[erp], unbind(s1,…,sn) Primul element al formei este o listă definind variabilele de control ale buclei, valorile lor de iniŃializare i de incrementare Astfel, fiec ărei variabile îi corespunde o listă formată din numele variabilei, eventual valoarea iniŃială i, când aceasta apare, eventual o form ă de incrementare a pasului Dac ă expresia de iniŃializare e omis ă, ea va fi implicit considerată nil Dac ă expresia de incrementare este omis ă, variabila nu va fi schimbată între pa ii consecutivi ai itera Ńiei (de i corpul lui do poate modifica valorile variabilei prin setq) Înainte de prima itera Ńie, toate formele de iniŃializare sunt evaluate i fiecare variabilă este legată la valoarea de iniŃializare corespunz ătoare (acestea sunt leg ări iar nu asign ări, astfel încât dup ă ie irea din itera Ńie, variabilele revin la valorile la care erau legate înainte de intrarea în itera Ńie) La începutul fiec ărei itera Ńii, dup ă procesarea variabilelor, o expresie de test et este evaluată Dac ă rezultatul este nil, execu Ńia continu ă cu evaluarea formelor din corpul do-ului: ec,…, ec Dac ă et este diferită de nil se evalueaz ă în ordine 1q formele er1,…, erp, ultima valoare fiind i cea întoars ă de do La începutul oric ărei itera Ńii, cu excep Ńia primei, variabilele sunt actualizate astfel: toate formele de incrementare sunt evaluate de la stânga la dreapta i rezultatele reprezintă valorile la care sunt legate variabilele în paralel În cazul formei do*, evaluarea formelor de iniŃializare urmată de legarea variabilelor la aceste valori, atât la iniŃializare cât i la fiecare ciclu al itera Ńiei, se efectueaz ă serial: (do* ((s1 ’ei ’es)… (sn ’ei ’es)) (’et ’er… ’er) ’ec… ’ec) 11nn1p1q >>> erp | ei1,s1ei1,…,ein,snein,while(not et){ec1,…, ecq,es1,s1es1,…,esn,snesn},er1,…,[erp],unbind(s1,…, sn) Exemplele urm ătoare exploateaz ă leg ările paralele ale variabilelor de index: (defun list-reverse(lst) (do ((x lst (cdr x)) (y '() (cons (car x) y))) ((endp x) y))) 57 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Func Ńia list-reverse9, realizeaz ă inversarea unei liste Variabila de ciclu x se leag ă la liste din ce în ce mai scurte din cea iniŃială, lst, în timp ce variabila y pleac ă de la lista vid ă i adaug ă la fiecare itera Ńie primul element al listei x Când x ajunge la lista vid ă do se termin ă întorcând valoarea acumulată în y (defun rev (lst) (cond ((null lst) nil) ((null (cdr lst)) lst) (t (do ((z (cddr lst) (cdr z)) (y (cdr lst) z) (x (progn() (rplacd lst nil) lst) y)) ((null z) (rplacd y x) y) (rplacd y x))))) Func Ńia rev definită aici realizeaz ă, de asemenea, inversa unei liste, dar, spre deosebire de exemplul precedent, nu se consum ă alte celule de memorie fa Ńă de cele în care era memorată lista dată în intrare Cu alte cuvinte, lista se inverseaz ă “în ea îns ăi” Primele dou ă clauze cond trateaz ă lista vid ă i lista formată dintr-un singur element Orice listă care are minimum dou ă elemente este preluată de do Variabilele x, y i z Ńin minte la fiecare ciclu trei celule cons aflate în secven Ńă în lista iniŃială La iniŃializare, cdr-ul celulei de pe prima poziŃie (indicată de x) este făcut nil pentru a realiza sfâritul de listă Opera Ńia efectiv ă a fiec ărui pas, realizată pe ultimul rând al definiŃiei de func Ńie, constă în modificarea p ărŃii cdr a elementului din mijloc (y) pentru a indica elementul precedent (x) Dup ă realizarea opera Ńiei din ciclu, variabilele îi transferă una alteia valorile în paralel mutându-se toate cu câte un element mai spre sfâritul listei iniŃiale Când ultima variabilă (z) devine nil înseamn ă că y indic ă ultimul element al vechii liste, ca urmare îns ăi cdr-ul acesteia este modificat la elementul precedent i se întoarce valoarea indicată de ea, care reprezintă acum cap ătul listei inversate 2 5 8 Valori multiple i exploatarea lor Dup ă cum s-a putut vedea, o seam ă de func Ńii, printre care floor i ceiling, întorc valori multiple O generare explicită de valori multiple se poate face cu formele values-list i values: > (values-list (list 'a 'b 3 'c)) A B 3 C > (values 'a 'b 3 'c) A B 3 C Diferen Ńa dintre ele este c ă prima solicită o listă pe când a dou ă prime te valorile pe care le “multiplic ă” ca simple argumente Cea mai simplă metod ă de exploatare a valorilor multiple constă în transformarea lor în liste Forma multiple-value-list face acest lucru: 9 Exemplu preluat din (Steele, 1990) 58 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială > (multiple-value-list (ceiling 7 3)) (3 -2) Se observ ă c ă values-list i multiple-value-list sunt inverse una alteie: > (multiple-value-list (values-list (list 'a 'b 3 'c))) (A B 3 C) > (values-list (multiple-value-list (ceiling 7 3))) 3 -2 Forma multiple-value-call transferă valori multiple, ca argumente, unui apel de func Ńie Func Ńionala care asambleaz ă valorile multiple trebuie dată ca prim argument al apelului: > (multiple-value-call #'list 1 (ceiling 7 3) (values 5 6) 'alpha) (1 3 -2 5 6 ALPHA) O form ă (macro) care produce leg ări (genereaz ă domenii) prin exploatarea valorilor multiple este multiple-value-bind Sintaxa (simplificată) este urm ătoarea: (multiple-value-bind ({var}*) values-form {form}* ) >>> {result}* în care var reprezintă un nume de variabilă, values-form este o form ă care genereaz ă valori multiple, iar form reprezintă corpul în care leg ările sunt valorificate Ultima form ă evaluată genereaz ă valoarea/valorile întoars ă/întoarse de macro > (multiple-value-bind (x y) (ceiling 7 3) (list x y)) (3 -2) 2 5 9 Închideri10 Combina Ńia dintre o func Ńie i un set de leg ări de variabile libere ale func Ńiei la momentul apelului acelei func Ńii se nume te închidere ( closure) Închiderile sunt func Ńii împreun ă cu stări locale În exemplul urm ător, se definete o închidere la nivelul apelului lui mapcar, pentru care n este o variabilă liberă Ea dispare la nivelul definiŃiei func Ńiei list+: > (defun list+ (lst n) (mapcar #'(lambda (x) (+ x n)) lst)) > (list+ '(1 2 3) 10) (11 12 13) 10 Exemplele din această sec Ńiune sînt preluate din (Graham, 1994) 59 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Urm ătoarele func Ńii folosesc împreun ă o variabilă comun ă ce serve te de num ărător Închiderea contorului într-un let în loc de a-l considera o variabilă globală îl protejeaz ă asupra referirilor accidentale > (let ((counter 0)) (defun new-id () (incf counter)) (defun reset-id () (setq counter 0))) În urm ătorul exemplu avem o func Ńie care la fiecare apel întoarce o func Ńie împreun ă cu o stare locală: > (defun make-adder (n) #'(lambda (x) (+ x n))) > (setq add2 (make-adder 2) add10 (make-adder 10)) # > (funcall add2 5) 7 > (funcall add10 3) 13 Func Ńia make-adder prime te un num ăr i întoarce o închidere, care, atunci când e chemată, adun ă num ărul la argument În această variantă în închiderea întoars ă de make-adder starea intern ă e constantă Urm ătoarea variantă realizeaz ă o închidere a c ărei stare poate fi schimbată la anumite apeluri: > (defun make-adder-b (n) #'(lambda (x &optional change) (if change (setq n x) (+ x n)))) > (setq addx (make-adder-b 1)) # > (funcall addx 3) 4 > (funcall addx 100 t) 100 > (funcall addx 3) 103 2 5 10 Transferul argumentelor în func Ńii În transferul prin valoare (Figura 2 8), înaintea evalu ării func Ńiei, valorile actuale ale parametrilor se copiaz ă ca valori ale parametrilor formali ai func Ńiei Modific ări ale valorilor parametrilor formali în timpul evalu ării func Ńiei nu afecteaz ă valorile parametrilor actuali: 60 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială F(a) a: v1 x: v1 în momentul apelului F(x) x := v2 x: v2 în timpul evalu ării lui F Figura 2 8: Transferul prin valoare, în general În transferul prin referin Ńă (Figura 2 9) numele parametrilor formali reprezintă sinonime ale numelor parametrilor actuali Modificarea valorilor parametrilor formali în timpul evalu ării func Ńiei provoac ă astfel o schimbare a îns ăi valorilor parametrilor actuali Această modificare reprezintă, a adar, un efect lateral al evalu ării func Ńiei: F(a) a: v1 F(x) x:a: v1 în momentul apelului x := v2 x:a: v2 în timpul evalu ării lui F Figura 2 9: Transferul prin referin Ńă, în general Transferul în Lisp nu se face nici prin valoare nici prin referin Ńă, dar ambele tipuri pot fi simulate În Lisp un parametru formal se leag ă la valoarea comunicată prin parametrul actual Atunci când, în interiorul func Ńiei, are loc o asignare a unei noi valori variabilei formale, ea este dezlegată de la valoarea veche i legată la una nou ă (Figura 2 10) F(a) a v1 x (defun F(x) în momentul apelului (setq x v2) ) x v2 în timpul evalu ării lui F Figura 2 10: Transferul prin valoare în Lisp 61 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Comportamentul este, a adar, acela al unui transfer prin valoare atât timp cât în corpul func Ńiei se realizeaz ă numai deasign ări ale valorilor parametrilor formali Îndată îns ă ce în corpul func Ńiei au lor modific ări “chirurgicale” ale valorii parametrilor formali, func Ńionarea cap ătă trăsăturile unui transfer prin referin Ńă (Figura 2 11) pentru c ă în acest mod parametrul actual „simte” transform ările structurii accesate temporar prin parametrul formal F(a) a v1 a v2 (defun F(x) x în momentul apelului x în timpul evalu ării lui F (rplaca x v2) ) Figura 2 11: Transferul prin referin Ńă în Lisp 2 6 Macro-uri 2 6 1 DefiniŃie, macroexpandare i evaluare Un macro este în esen Ńă o func Ńie care define te o func Ńie Macro-urile sunt i mijloace prin care sintaxa Lisp-ului poate fi extins ă Evaluarea apelurilor de macro-uri este un proces în doi pa i: întâi o expresie specificată în definiŃie este construită, apoi această expresie este evaluată Primul pas – cel al construirii macro-expresiei se nume te macroexpandare O definiŃie de macro, analog unei definiŃii de func Ńie, conŃine trei elemente: un simbol care d ă numele macro-ului, o listă de parametri i corpul Într-un apel de func Ńie definită de utilizator, parametrii actuali sunt evalua Ńi înainte ca parametrii formali din definiŃie s ă se lege la ace tia Rezultă c ă o evaluare diferen Ńiată a parametrilor nu poate fi realizată printr-o definiŃie de func Ńie Toate formele Lisp-ului în care parametrii se evalueaz ă diferen Ńiat sunt realizate intern ca macro-uri Dac ă ar fi s ă realiz ăm o func Ńie care s ă aib ă comportamentul unui if, de exemplu, utilizând îns ăi forma if pentru aceasta, o definiŃie precum urm ătoarea: > (defun my-if(test expr-da expr-nu) (if test expr-da expr-nu)) nu satisface, pentru c ă la intrarea în func Ńie to Ńi cei trei parametri sunt evalua Ńi Astfel, într-un apel în care am dori s ă atribuim variabilei x valoarea DA sau NU, în func Ńie de un argument, de genul (my-if t (setq x ’da) (setq x ’nu)), cu toate că testul se evalueaz ă la T, x ar fi întâi setat la DA i apoi la NU, el rămânând în cele din urm ă cu această valoare Apelul de func Ńie întoarce îns ă valoarea celui de al doilea parametru: 62 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială > (my-if t (setq x ’da) (setq x ’nu)) DA > x NU Un apel de macro poate include un alt apel de macro Evaluarea unui apel al acestuia produce, mai întâi, expandarea lui, generând inclusiv un apel al macro-ului interior Urmeaz ă apoi faza de evaluare propriu-zis ă a macro-ului exterior în care, la un moment dat, se lanseaz ă evaluarea macro-ului interior Ca urmare, la rândul lui, acesta mai întâi se expandeaz ă i, într-o a doua faz ă abia, se evalueaz ă Procesul poate continua în acela i mod pe oricâte niveluri de apeluri de macro-uri în macro- uri, ceea ce presupune inclusiv posibilitatea de a scrie definiŃii de macro-uri recursive Macroexpand ările au loc la momente diferite în diverse implement ări Comportamentul descris mai sus este tipic unei implementări de genul interpretorului Acesta a teaptă momentul evalu ării apelului de macro pentru a face macroexpandarea macro-ului Aceasta înseamn ă c ă orice macro trebuie definit înaintea codului care se referă la el i c ă dac ă un macro este redefinit, orice func Ńie care referă macro-ul trebuie de asemenea redefinită Un compilator va efectua toate macroexpand ările la momentul compilării Un apel de macro ce apare în corpul definiŃiei unei func Ńii va fi expandat la momentul compilării func Ńiei, dar expresia (sau codul obiect rezultat) nu va fi evaluată pân ă ce func Ńia nu e chemată Rezultă c ă un compilator nu are cum trata apeluri recursive de macro-uri, pentru c ă el are tendin Ńa de a expanda apelul interior înainte de evaluare, ceea ce duce la un alt apel de macro, care trebuie i el expandat a m d , făcând astfel imposibilă controlarea acestui proces > (defmacro nthb (n lst) `(if (= ,n 0) (car ,lst) (nthb (- ,n 1) (cdr ,lst)))) NTHB > (nthb 2 '(a b c d e)) C > (defmacro fact(n) `(if (zerop ,n) 1 (* ,n (fact (- ,n 1))))) FACT > (fact 4) 24 Este important s ă facem distinc Ńia dintre aceste dou ă momente, respectiv obiectele asupra c ărora opereaz ă ele, în evaluarea unui macro: pasul macroexpand ării opereaz ă cu expresii, cel al evalu ării – cu valorile lor 2 6 2 Despre apostroful-stânga ( backquote) Un apostrof-stânga (`) construie te o form ă Lisp conform modelului (template) care urmeaz ă dup ă el Sintactic, el prefixează o listă La evaluare orice form ă a listei va fi copiată, cu excep Ńia: - formelor prefixate de virgulă ( ,), care sunt evaluate; - unei liste prefixată de o secven Ńă virgulă-at ( ,@), care provoac ă inserarea elementelor listei 63 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială > (setq b 'beta d 'gamma) GAMMA > `(a ,b c ,d) (A BETA C GAMMA) > (setq x ‘(a b c)) (A B C) >`(x 1 ,x 2 ,@x) (X 1 (A B C) 2 A B C) > `(a (x 1) (,x 2)) (A (X 1) ((A B C) 2)) Apostroful-stânga însu i poate fi copiat într-o expresie prefixată cu apostrof- stânga: > (setq x '(a b c)) (A B C) > `(a `b ,x) (A `B (A B C)) Putem acum relua definiŃia unui macro cu comportamentul lui if: > (defmacro my-if(test expr-da expr-nu) `(if ,test ,expr-da ,expr-nu)) MY-IF > (my-if t (setq x 'da) (setq x 'nu)) DA > x DA Restric Ńii privind folosirea virgulei i a virgulei-at : • virgula poate s ă apară numai în interiorul unei expresii prefixate cu apostrof-stânga: > `(a ,(cons ,x '(alpha beta)) ,x) Error: Comma not inside a backquote [file position = 12] • pentru ca elementele unei liste s ă fie expandate prin virgulă-at , locul acesteia trebuie s ă fie într-o secven Ńă E o eroare a se scrie la prompter: ,@x • obiectul de inserat trebuie s ă fie o listă, cu excep Ńia cazului în care apare ca ultim element într-o listă Astfel expresia `(a ,@1) se va evalua la (a 1), dar `(a ,@1 b) va genera un mesaj de eroare Virgule-at se folosesc cu predilec Ńie în definiŃiile macro-urilor cu un num ăr nedefinit de argumente 2 6 3 Asupra manierei de construc Ńie a macro-urilor11 Se începe prin a scrie un apel al macrou-lui ce se dore te a fi definit, urmat de expresia în care se dore te ca acesta s ă fie expandat Din apelul de macro se construie te lista de parametri alegând câte un nume pentru fiecare argument Între 11 Exemplele din această sec Ńiune i urm ătoarele sunt reproduse din (Graham, 1994) 64 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială rândul apelului i cel al expand ării se traseaz ă s ăge Ńi între argumentele corespunz ătoare (Figura 2 12) (memq x choices) apelul (member x choices :test #’eq) expandarea (defmacro memq (obj lst) definiŃia `(member ,obj ,lst :test #’eq)) Figura 2 12: Reguli de dezvoltare a macro-urilor Cazul unui macro cu un num ăr oarecare de argumente vom începe, la fel, prin a scrie un e antion de apel de macro Plecând de la acesta, construim lista de parametri ai macrou-lui, dar în care, în afară de parametrul care realizeaz ă testul, vom descrie corpul macro-ului printr-un parametru &rest sau &body Să presupunem c ă vrem s ă scriem un while care prime te un test i un corp format dintr-un num ăr oarecare de expresii Evaluarea lui va însemna buclarea expresiilor corpului atât timp cât expresia din test întoarce o valoare diferită de nil Apel: (my-while (not running-engine) (look-at-engine) (or (ask-advice) (think)) (try-to-fix-the-motor) (turn-on-the-key)) (defmacro while (test &rest body) Scriem apoi expansiunea dorită sub apel i unim prin linii argumentele din corpul de apel cu poziŃia lor din expansiune, dar unde secven Ńa din expansiune ce va corespunde unicului parametru din apel este grupată, ca aici: (do () ((not(not running-engine))) (look-at-engine) (or (ask-advice) (think)) (try-to-fix-the-motor) (turn-on-the-key)) 65 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială În corpul definiŃiei, apoi, parametrul &rest (sau &body) va fi prefixat cu virgula-at : (defmacro my-while (test &body body) `(do () ((not ,test)) ,@body)) 2 6 4 Cum se testeaz ă macro-expand ările? Func Ńia macroexpand-1 arată primul nivel al expand ării Func Ńia macroexpand arată toate nivelurile unei expand ări >(do ((w 3) (x 1 (1+ x)) (y 2 (1+ y)) (z)) ((> x 10) (princ z) y) (princ x) (princ y)) > (macroexpand-1 '(do ((w 3) (x 1 (1+ x)) (y 2 (1+ y)) (z)) ((> x 10) (princ z) y) (princ x) (princ y))) (BLOCK NIL (LET ((W 3) (X 1) (Y 2) (Z)) (TAGBODY #:$CFNH (WHEN # #) (PRINC X) (PRINC Y) (PSETQ X # Y #) (GO #:$CFNH) #:$CFNI) (PRINC Z) Y)) T 2 6 5 Asupra destructuriz ării Forma destructuring-bind prime te un ablon, un argument ce se evalueaz ă la o listă i un corp de expresii i evalueaz ă expresiile cu parametrii din ablon lega Ńi la elementele corespunz ătoare din listă: > (destructuring-bind (x (y) z) '(a (b) c d) (list x y z)) (A B (C D)) 66 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Destructurizarea e posibilă, de asemenea, în listele parametrilor macro-urilor Într-o definiŃie de macro, defmacro, se permite ca listele de parametri s ă fie structuri de liste arbitrare Când un macro de acest fel e expandat, componentele apelului vor fi asignate parametrilor ca printr-un destructuring-bind: > (defmacro our-dolist ((var list &optional result) &body body) `(progn (mapc #'(lambda (,var) ,@body) ,list) (let ((,var nil)) ,result))) OUR-DOLIST > (our-dolist (x '(a b c)) (print x)) A B C NIL > (our-dolist (x '(a b c) 'bravo) (print x)) A B C BRAVO 2 6 6 Când s ă folosim macro-uri? Există buc ăŃ i de cod care pot fi scrise atât ca macro-uri cât i ca func Ńii De exemplu: (defun 1+ (x) (+ 1 x)) (defmacro 1+ (x) `(+ 1 ,x)) Un while îns ă nu poate fi scris decât ca un macro: (defmacro while (test &body body) `(do () ((not ,test)) ,@body)) pentru c ă el integreaz ă expresiile pe care le prime te ca body în corpul unui do unde ele vor fi evaluate numai dac ă test întoarce true Printr-un macro se pot controla evalu ările argumentelor din apel Orice operator care trebuie s ă acceseze parametrii înainte ca ace tia s ă fie evalua Ńi trebuie scris ca macro 2 6 7 Argumente pro i contra utiliz ării macro-urilor Evaluarea la momentul compilării: (defun avg (&rest args) (/ (apply #’+ args) (length args))) (defmacro avg (&rest args) 67 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială `(/ (+ ,@args) ,(length args))) În prima definiŃie (length args) este evaluată la momentul rulării pe când în cea de a doua – la momentul compilării: > (macroexpand-1 '(avg 1 3 4 6)) (/ (+ 1 3 4 6) 4) T 2 7 Un exemplu de program care se modific ă în timpul rulării Mai jos, simbolului animal îi este atribuită o expresie care, dac ă este lansată în evaluare, iniŃiaz ă un dialog ce duce la recunoa terea unui animal Atunci când recunoa terea este eronată, programul cere interlocutorului informa Ńii pentru rafinarea dialogului Secven Ńa nou ă de dialog astfel generată este inserată în program, astfel încât, la o evaluare ulterioară, arborele de decizie al programului este mai bogat În acest fel, prin rulări repetate, cunoa terea programului asupra diferitelor animale se perfec Ńioneaz ă (setq animal '(let ((int)(aniF)) (print "Animalul are sange cald? ") (setq ras (if (read) (print "caine") (print "lacusta"))) (print "ok? ") (if (not (read)) (progn (my-print (list "Puneti o intrebare la care " ras " sa fie raspunsul pozitiv: ")) (setq int (read-line)) (print "Animalul pentru NIL: ") (setq aniF (string (read))) (modify animal (list 'print ras) (list 'progn (list 'print int) (list 'if (list 'read) (list 'print ras) (list 'print aniF))) ) )) )) (defun modify(str old new) (cond ((or (atom str) (null str)) nil) ((equal (car str) old) (rplaca str new) T) ((modify (car str) old new) t) (t (modify (cdr str) old new)))) (defun my-print (l) (cond ((null l) (terpri)) (t (princ (car l)) (my-print (cdr l))))) Ceea ce urmeaz ă este un dialog în care utilizatorul are în minte animalul opârl ă: > (eval animal) "Animalul are sange cald? "nil "lacusta" "ok? "nil 68 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Puneti o intrebare la care lacusta sa fie raspunsul pozitiv: Animalul zboara? "Animalul pentru NIL: "soparla T > (eval animal) "Animalul are sange cald? "nil "Animalul zboara?"nil "SOPARLA" "ok? "t NIL Cerin Ńe pentru studen Ńi Să fie capabili s ă implementeze algoritmi în LISP prin func Ńii i macro-uri Să poată citi o expresie LISP Probleme P2 1 a) S ă se scrie o func Ńie LISP care s ă creeze structura din Figura 2 13a b) S ă se scrie o func Ńie care modific ă această structură în cea din Figura 2 13b c) Ce va întoarce (eq (car (cdr (caddr X))) (car (cdddr X)))? X X Y ZW Y Zx Y a b Figura 2 13: a Structura iniŃială b Structura transformată P2 2 a) S ă se construiasc ă structură de celule cons din Figura 2 14a b) S ă se modifice apoi la forma din Figura 2 14b c) La ce se evalueaz ă (eq (car x) (cadr x)) - în primul caz; - i în cel de al doilea caz 69 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială x x beta beta a b Figura 2 14: a Structura iniŃială b Structura transformată P2 3 S ă se explice ce întoarce urm ătorul program Lisp: (defun boo(foo) (cond ((null foo) 0) (t (+ 1 (boo (cdr foo)))))) (boo ‘(alpha beta gamma)) P2 4 S ă se transforme urm ătoarea func Ńie recursiv ă într-una iterativ ă: (defun boo-iter(foo) (let ((temp 0)) (while foo (setq temp (+ 1 temp) foo (cdr foo))))) P2 5 Fie X o mulŃime de elemente ordonate cresc ător, X=( x1, x2 … xn), reprezentând puncte pe o ax ă, i fie f(x) o func Ńie Scrie Ńi diverse variante de func Ńii LISP care s ă calculeze mulŃimea Y=(f( x1), f( x2) f( xn)) Bibliografie Church, A , 1941 The Calculi of Lambda-Conversion, Princeton University Press, Princeton, N J Giumale, Cr , Preo Ńescu, D , erb ăna Ńi, L D 1987 LISP, vol 1, Editura Tehnic ă, Bucure ti Graham, P , 1994 On Lisp Advanced Techniques for Common Lisp Prentice Hall, Englewood Cliffs, New Jersey McCarthy, J 1960 Recursive Functions of Symbolic Expressions and Their Computation by Machine, în „Communications of the ACM” (poate fi accesată la http://www- formal stanford edu/jmc/recursive pdf) 70 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Steele, G L , 1990 Common Lisp the Language, 2nd edition, Digital Press (versiune on-line la http://www cs cmu edu/Groups/AI/html/cltl/cltl2 html) Trăuan-Matu, 2004 Programare în LISP Inteligen Ńă Artificială i web semantic Editura Polirom, Ia i, 2004 Tufi D 1987 TC-LISP-Func Ńiile primitive ale interpretorului Manual de programare, ITCI, 98 p Tufi, D , Cristea, D , Tecuci, D 1987 LISP, vol 2, Editura Tehnic ă, Bucure ti Tufi D , O Popescu 1987 TC-LISP-Biblioteca de func Ńii Manual de programare, ITCI, 101 p Situri unde g ăsiŃi documenta Ńie, cursuri i produse: http://www franz com/ – situl companiei Franz Inc care produce i comercializeaz ă Allegro Common Lisp În sec Ńiunea Free Downloads pute Ńi g ăsi ultimele versiuni de Common Lisp (CL 8 0 în februarie 2007) Allegro CL Certification Program la http://www franz com/services/classes/ oferă gratis cursuri on- line în vederea ob Ńinerii certificatelor de dezvoltator CL 71 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Capitolul 3 Căutare Rezolvarea problemelor Sisteme de produc Ńie Diametrul interior al unei Ńevi nu trebuie s ă-l dep ăeasc ă pe cel exterior, altfel gaura va fi pe dinafară Michael Stillwell 3 1 Formalizarea problemelor de IA În acest capitol vom vedea cum pot fi formalizate, în vederea rezolv ării, problemele specifice domeniului IA În multe privinŃe formalizarea unei probleme de IA este diferită de cea a unei probleme de altă natură De i reguli generale sunt dificil de formulat, pentru c ă varietatea acestor probleme este extrem de mare, vom enun Ńa câteva precepte care pot ghida acest proces 3 1 1 Problem ă, instan Ńă de problem ă, spa Ńiul stărilor De foarte multe ori, când vorbim de o solu Ńie în domeniul IA ne intereseaz ă pa ii în rezolvarea unei probleme, mai mult decât nite date care s ă fie ob Ńinute în ie ire ca rezultat al unor procese de calcul aplicate unor date prezentate în intrare Să lu ăm ca exemplu jocul de ah O poziŃie de pe tablă reprezintă complet starea jocului într-un anumit moment Evolu Ńia jocului poate fi privită ca o secven Ńă de tranziŃii dintr-o stare în alta, plecând de la o stare iniŃială i ajungând pân ă într-o stare finală Există o stare iniŃială descris ă de o poziŃie standard, întotdeauna aceea i în orice joc de ah Nu există o anume stare finală, dar poate fi considerată stare finală orice configura Ńie a tablei în care un rege se află într-o poziŃie atacată i nu poate ie i din acea poziŃie prin nici o mutare legală Între aceste dou ă stări există un num ăr finit, dar extrem de mare, de posibilităŃ i de a ajunge prin mutări legale Num ărul total de poziŃii ale jocului de ah formeaz ă ceea ce se nume te spa Ńiul stărilor Vom exemplifica formalizarea problemelor de IA pe câteva exemple de probleme considerate clasice în domeniu Astfel de probleme, datorită dimensiunii lor mici, sunt cunoscute sub numele de probleme jucărie ( toy problems) În multe cazuri studiul lor ajută la identificarea metodologiei de rezolvare a problemelor de dimensiune reală În alte cazuri îns ă diferen Ńa de dimensiune între problemele juc ărie i cele reale este atât de mare încât solu Ńiile probate pe primele nu pot fi aplicate pe cele din urm ă i într-un caz i în celălalt, studiul problemelor juc ărie constituie un antrenament util pentru dezvoltarea abilităŃ ilor de a lucra cu concepte ale domeniului IA 72 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Problema 8-puzzle: Există o tablă 3x3 pe care se g ăsesc i se pot muta 8 piese pătrate La un moment dat, o singură pies ă poate fi micată cu o poziŃie, pe orizontală sau verticală, în limitele cadrului tablei, în singurul loc liber Plecând de la o configura Ńie iniŃială a tablei trebuie s ă se ajung ă într-alta, ce este de asemenea dată Problema misionarilor i canibalilor : 3 misionari i 3 canibali se află la marginea unui râu i doresc s ă treac ă pe celălalt mal Ei au la dispoziŃie o barc ă de dou ă persoane Dac ă la un moment dat, pe un mal sau pe celălalt num ărul canibalilor întrece pe cel al misionarilor, misionarii sunt în pericol de a fi mânca Ńi de canibali Problema constă în a afla cum pot trece râul cele 6 persoane în deplin ă siguran Ńă Problema gener ării frazelor în limbaj natural : Se dispune de un lexic (prin care fiec ărui cuvânt i se ata eaz ă o parte de vorbire) i de o gramatic ă (care este o colec Ńie de reguli, fiecare spunând cum poate fi expandat o categorie compus ă în subcompu i) Se dore te generarea unei exprim ări corecte gramatical Prima preocupare într-o problem ă de IA este de a recunoa te în problema generală instan Ńele acesteia Nu poate fi considerat juc ător de ah un personaj capabil s ă rezolve doar o anume situa Ńie de pe tabla se joc, ci cel capabil s ă abordeze orice situa Ńie Analog, nu poate fi considerat conduc ător auto o persoan ă capabilă s ă mite ma ina numai de acas ă pân ă la serviciu Ca s ă merite acest titlul, teoretic cel pu Ńin, acea persoan ă trebuie s ă poată conduce ma ina din orice punct în orice alt punct Aceste exemple vor s ă pun ă în eviden Ńă diferen Ńa dintre probleme i instan Ńe ale lor Jocul de ah define te o problem ă Conducerea ma inii – o alta În cazul jocului de ah, de obicei se precizeaz ă o poziŃie iniŃială i o indica Ńie asupra termin ării (de exemplu, care juc ător trebuie s ă câ tige, eventual i în câte mutări) În cazul conducerii ma inii, se precizeaz ă unde se află ma ina, unde trebuie ea adus ă i se cunoa te o hartă pe care sunt marcate drumurile pe care poate ea circula Astfel de descrieri definesc instan Ńe de problem ă În problema 8-puzzle o instan Ńă este dată de o anumită pereche formată din configura Ńia iniŃială i finală a tablei În problema misionarilor i canibalilor, a a cum este ea formulată, nu există decât o unic ă instan Ńă Dar ea suportă un enun Ń general care s ă admită i alte instan Ńe de problem ă, spre exemplu cazul a n canibali i a n misionari O instan Ńă poate fi atunci problema în care apar 3 canibali + 3 misionari, alta cea în care apar 4 canibali + 4 misionari etc 73 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială În problema generării limbajului o instan Ńă de problem ă este dată de o gramatic ă Astfel, de exemplu, am putea avea gramatica G1 = {N1, T1, S1, P1}, în care: N1 = {PROP, GN, GV, S, V} – o mulŃime de simboluri neterminale cu semnifica Ńiile: propoziŃie, grup nominal, grup verbal, substantiv i verb; T1 = { pisica , oarecele , prinde } – o mulŃime de cuvinte; S1 = {PROP} – un simbol de start al gramaticii, alegerea lui semnificând c ă ceea ce se dore te s ă se ob Ńin ă reprezintă propoziŃii ale acestui mini-limbaj; P1 = {PROP := GN GV, GN := S, GV := V GN, S := pisica , S := oarecele , V := prinde } – o mulŃime de reguli de produc Ńie, cu semnifica Ńia evidentă O instan Ńă de problema, în acest caz, ar cere ob Ńinerea unei propoziŃii oarecare în limbajul descris de această gramatic ă Toate instan Ńele aceleia i probleme au ceva în comun: maniera de rezolvare Acela i algoritm ar trebui s ă lucreze pentru orice instan Ńă a unui probleme date Având o solu Ńie pentru cazul general, rezolvarea unei anumite instan Ńe reprezintă doar o chestiune de alimentare a programului cu alte date de intrare Din acest punct de vedere o problem ă de IA nu se deosebe te cu nimic de o problem ă clasic ă 3 1 2 Recunoa terea stărilor O stare reprezintă a configura Ńie anumită a entităŃ ilor care populeaz ă universul problemei în drumul spre solu Ńie Nu este îns ă întotdeauna elementar s ă se decid ă care dintre momentele intermediare ale drumului spre solu Ńie trebuie considerată stare i care nu Dac ă am imagina un film care red ă drumul spre solu Ńie, întrebarea la care trebuie s ă răspundem este ce cadre reprezintă imagini de stări i care nu De asemenea, este foarte util s ă putem aprecia cât de mare este spa Ńiul stărilor A doua preocupare într-o problem ă de IA este de a recunoa te o stare i de a aprecia dimensiunea spa Ńiului stărilor În cazul jocului 8-puzzle recunoa tem imediat c ă o stare trebuie s ă reprezinte o configura Ńie anumită a tablei la un moment dat Ar fi greu de imaginat de ce o alegere a stării ca, de exemplu, aceea în care piesa mobilă s ă fie într-o poziŃie intermediară între un cadru i urm ătorul, ar avea vreo semnifica Ńie anumită în rezolvarea problemei Dimensiunea problemei este dat ă de num ărul stărilor teoretic posibile în rezolvarea problemei La 8-puzzle num ărul acestora este 9!=362 880 pentru c ă avem 9 posibilităŃ i de a a eza o pies ă pe tabla goală, pentru fiecare poziŃie a acesteia – avem 8 posibilităŃ i de a o a eza pe a doua, a m d În problema canibalilor i misionarilor o stare este o ipostaz ă anumită în traversarea râului Filmul, prin însu i esen Ńa lui de nara Ńiune vizuală, abund ă în detalii Oare ce cadre ale filmului care ar nara vizual traversarea care convine ca 74 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială rezolvare a problemei pot fi luate ca reprezentative pentru a descrie stări? Cea mai adecvată ipostaz ă de stare aici este o situa Ńie în care barca se află pe unul din maluri i în care avem un num ăr de misionari i unul de canibali pe malul cu barca în timp ce restul lor se află pe celălalt mal Nu avem nici un motiv s ă credem c ă o poziŃie intermediară, de exemplu aceea în care barca s-ar afla la mijlocul râului în cursul unei travers ări, ar putea s ă ne intereseze Considerarea acestor cadre intermediare drept stări ar m ări nejustificat spa Ńiul stărilor Ca s ă în Ńelegem de ce este inutilă considerarea unei poziŃii intermediare în traversarea râului, drept stare, să observ ăm c ă din poziŃia în care barca se află pe unul din maluri, cu un num ăr anumit de misionari i canibali pe fiecare mal, i pân ă în situa Ńia în care barca este pe malul opus, cu o altă combina Ńie de misionari i canibali pe ambele maluri, am putea s ă deducem – modulo un num ăr de detalii fără importan Ńă – toate poziŃiile intermediare în care barca s-ar fi aflat între un mal i celălalt Considerarea drept stare a oric ărei poziŃii intermediare nu aduce deci nici un spor de informa Ńie fa Ńă de cazul în care am ignora-o Prin aceasta deducem c ă spa Ńiul stărilor problemei misionarilor i canibalilor este dat de num ărul posibil de combinaŃii c+m+b (cu c – num ărul de canibali, m – num ărul de misionari, b – existen Ńa ori nu a b ărcii) pe cele dou ă maluri, fiecare în parte respectând restric Ńia, s ă-i zicem de "ne-ingerare": b – ccc+mmm (invalid ă: barca e pe malul pe care nu se află nici un c ălător) m+b – ccc+mm (invalid ă: situa Ńie periculoas ă pe malul drept) mm+b – ccc+m (invalid ă: situa Ńie periculoas ă pe malul drept) mmm+b – ccc c+b – cc+mmm c+m+b – cc+mm c+mm+b – cc+m (invalid ă: situa Ńie periculoas ă pe malul drept) c+mmm+b – cc cc+b – c+mmm cc+m+b – c+mm (invalid ă: situa Ńie periculoas ă pe malul stâng) cc+mm+b – c+m cc+mmm+b – c ccc+b – mmm ccc+m+b – mm (invalid ă: situa Ńie periculoas ă pe malul stâng) ccc+mm+b – m (invalid ă: situa Ńie periculoas ă pe malul stâng) ccc+mmm+b – adic ă 9 stări valide cu barca pe malul stâng, la care se adaugă tot atâtea cazuri în care barca se află pe malul drept, deci un total de 18 stări În problema generării frazelor, o stare poate fi o configura Ńie de simboluri terminale i neterminale, la un anumit moment dat în derivare Spa Ńiul stărilor este corelat cu dimensiunea limbajului generat de gramatic ă, mai mare decât acesta, posibil infinită dac ă gramatica este recursiv ă În cazul particular al gramaticii date mai sus în această sec Ńiune, spa Ńiul total cuprinde aproximativ 37 de stări Comparând spa Ńiile acestor probleme cu cel al stărilor jocului de ah, care se tie c ă este de ordinul a 10120 putem în Ńelege de ce jocul de ah este mult mai greu de rezolvat decât oricare dintre problemele noastre juc ărie 75 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială 3 1 3 Reprezentarea stărilor În problema 8-puzzle, o stare poate fi reprezentată de o matrice 3x3 în care elementele sunt numere cuprinse între 0 (reprezentând spa Ńiul) i 9 O altă posibilitate ar fi s ă reprezentăm tabla ca trei vectori, fiecare cu câte trei poziŃii Alegerea uneia sau a alteia dintre posibilităŃ i depinde de u urin Ńa cu care se descriu condiŃiile asupra tablei i ac Ńiunile capabile s ă transforme o stare în alta, dup ă cum vom vedea mai departe Să observ ăm c ă în problema canibalilor i misionarilor este suficient s ă Ńinem minte situa Ńia de pe un mal i poziŃia b ărcii, pentru c ă situa Ńia de pe celălalt mal se ob Ńine prin diferen Ńă Deci o reprezentare adecvată poate fi aici un vector format din doi întregi (fiecare având valori cuprinse între 0 i 3) ce dau num ărul canibalilor, respectiv al misionarilor, de pe malul stâng, i o variabilă logic ă care define te existen Ńa ori nu a b ărcii pe malul stâng: (c, m, b) În problema generării limbajului, cum o posibilă stare este o combina Ńie de simboluri terminale i neterminale, reprezentarea unei stări poate fi un ir (listă) de simboluri Astfel, o derivare posibilă plecând de la gramatica aleas ă ca exemplu este: PROP GN GV S GV pisica GV pisica V GN pisica prinde GN pisica prinde S pisica prinde pisica Stările atinse în această rezolvare au fost în ordine: (PROP), (GN GV), (S GV), ( pisica GV), ( pisica V GN), ( pisica prinde GN), (pisica prinde S), ( pisica prinde pisica) A treia preocupare într-o problem ă de IA este g ăsirea celei mai adecvate reprezentări a stărilor 3 1 4 Reprezentarea tranziŃiilor între stări O solu Ńie într-o problem ă de IA înseamn ă g ăsirea unei c ăi între o stare iniŃială i o stare finală Putem s ă ne imagin ăm un proces de rezolvare în dou ă moduri: o manieră în care stările există deja, iar rezolvarea presupune o tranzitare, de c ătre un automat, a acestui spa Ńiu al lor deja generat i o alta în care stările se creeaz ă doar în momentul atingerii lor, ele neexistând anterior În primul caz o micare legală provoac ă p ărăsirea unei stări i trecerea în alta, în timp ce în al doilea caz o micare legală provoac ă generarea unei noi stări plecând de la una dată Deosebirea este de natură implementa Ńională i are, evident, o mare importan Ńă în eficien Ńa procesului de rezolu Ńie îns ă nu influen Ńeaz ă maniera generală de rezolvare a problemei A patra preocupare în descrierea unei probleme de IA este reprezentarea tranziŃiilor posibile între stări (reguli) Pentru efectuarea acestei "deplas ări" în spa Ńiul stărilor trebuie definit un set de operatori , sau reguli de produc Ńie, sau simplu reguli , care precizeaz ă micările legale Se întâmplă adesea ca acelea i tipuri de tranziŃii s ă poată fi aplicate între perechi de stări diferite Spre exemplu, în Figura 3 1 sunt sugerate prin s ăge Ńi de forme diferite patru tipuri de tranziŃii 76 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Figura 3 1: TranziŃiile între stări pot fi clasificate dup ă tipuri Dac ă este posibilă clasificarea tranziŃiilor pe tipuri, atunci este probabil ca acelea i tranziŃii s ă se aplice atunci când stările de plecare au ceva în comun, cu alte cuvinte îndeplinesc nite condiŃii similare Există mai multe modalităŃ i de a preciza tranziŃiile legale dintr-o stare în alta Una este de a le descrie "cu c ărŃile foarte aproape de ochi", cu alte cuvinte într-o manieră care s ă ia în considerare detalii legate anumite instan Ńe de problem ă În general ob Ńinem astfel un num ăr mare de reguli O descriere satisfăcătoare trebuie să se preocupe s ă fie suficient de generală pentru a o putea utiliza în cât mai multe instan Ńe date de problem ă De exemplu, o micare uzuală de deschidere la un joc de ah este avansarea pionului cu dou ă poziŃii Această micare a pionului nu este îns ă permis ă decât atunci când pionul se află în poziŃia lui iniŃială, în orice alt moment al jocului pionul putând avansa doar cu o poziŃie Am avea a adar o serie de reguli de forma: regula mut•-pion-din-a DAC• pion în pozi•ia (a,2) •i pozi•ia (a,3) e liber• •i pozi•ia (a,4) e liber• ATUNCI mut• pionul din pozi•ia (a,2) în pozi•ia (a,4) Vom avea un num ăr de 8 reguli de acest fel, câte una pentru fiecare pion O reprezentare mai economic ă ar utiliza o singură regulă capabilă s ă exprime poziŃia oric ărui pion aflat pe al doilea rând care avanseaz ă pe rândul patru 77 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială regula mut•-pion(x) DAC• pion în pozi•ia (x,2) •i pozi•ia (x,3) e liber• •i pozi•ia (x,4) e liber• ATUNCI mut• pionul din pozi•ia (x,2) în pozi•ia (x,4) În general o regulă este de forma: DAC Ă ATUNCI Activitatea pe care o poate desfăura o regulă poate fi exprimată astfel: dac ă partea de condiŃii este satisfăcută de starea curentă, atunci se realizeaz ă ac Ńiunile Uneori, partea de ac Ńiuni înseamn ă generarea unei noi stări, alteori doar tranzitarea într-o stare care era anterior generată Din cele de mai sus rezultă c ă preocuparea a patra constă în inventarierea tuturor tranziŃiilor posibile între stări i descrierea acestor tranziŃii ca reguli formate din condiŃii i ac Ńiuni Un set de reguli este specific unei probleme iar nu unei instan Ńe de problem ă Cu alte cuvinte, acela i set de reguli trebuie s ă poată fi aplicat pentru rezolvarea oric ărei instan Ńe a unei probleme date În 8-puzzle, reguli posibile ar putea fi: mută-1-sus, mută-1-jos, mută-1- dreapta, mută-1-stânga, mută-2-sus, a m d , fiecare dintre ele condiŃionând, bineîn Ńeles, executarea micării de existen Ńa unei poziŃii în direc Ńia respectiv ă cuprins ă în cadrul tablei Am avea astfel câte patru reguli pentru fiecare num ăr (plăcu Ńă), adic ă 32 de reguli Un salt calitativ în reprezentarea regulilor îl ob Ńinem îns ă dac ă în loc s ă ne intereseze mutarea unei piese ne-am concentra asupra mutării blancului Putem astfel s ă restrângem num ărul de reguli la 4: mută-blanc- sus, mută-blanc-jos, mută-blanc-dreapta, mută-blanc-stânga Regula mut•-blanc-sus DAC• blancul nu e lipit de marginea de sus a tablei ATUNCI schimb• pozi•ia blancului cu a c•su•ei aflat• deasupra acestuia În problema generării frazelor, o regulă ar trebui s ă mimeze destul de aproape o regulă de produc Ńie a gramaticii, pentru c ă, între o stare i urm ătoarea, un simbol aflat în partea stâng ă a unei reguli dispare, locul lui fiind luat de simbolurile aflate în partea dreaptă a regulii Ca urmare vom avea tot atâtea reguli ale sistemului de IA câte reguli de produc Ńie are gramatica 3 1 5 C ăutarea solu Ńiei Am discutat pân ă acum despre spa Ńiul stărilor unei probleme i am înv ăŃ at să alegem o reprezentare pentru stări tim c ă tranziŃiile între stări sunt descrise de un set de operatori pe care le-am numit reguli de produc Ńie i am v ăzut c ă a rezolva o problem ă înseamn ă a g ăsi un drum între o stare iniŃială i una sau mai multe stări finale ce sunt cunoscute precis ori numai descrise printr-un set de 78 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială restric Ńii Maniera în care organiz ăm c ăutarea în spa Ńiul stărilor, deci modul în care înlănŃuim operatorii pentru g ăsirea solu Ńiei constituie urm ătoarea preocupare Problemele de IA se aseam ănă prin aceea c ă în toate rezolvarea presupune nu g ăsirea unei anume stări, ci g ăsirea unui drum care s ă uneasc ă o stare iniŃială de una finală Atunci când starea finală nu este precizată cu exactitate, g ăsirea unui drum c ătre o stare, care este recunoscută ca fiind finală prin satisfacerea unor constrângeri specifice, coincide, totodată, cu darea unui răspuns a teptat stare fund ătură stare finală posibilă tranziŃie stare finală atins ă stare iniŃială solu Ńie dimensiunea spa Ńiului stărilor Figura 3 2: Rezolvarea unei probleme de IA prin navigare în spa Ńiul stărilor Acest lucru face ca o problem ă de IA s ă fie una de c ăutare într-un spa Ńiu al stărilor Din cauz ă c ă, adesea, spa Ńiul stărilor este foarte mare se utilizeaz ă diferite strategii pentru a eficientiza c ăutarea Există mai multe tipuri de strategii, dar ele sunt clasificate în dou ă clase mari: irevocabile i tentative Aplicarea unei strategii este necesară pentru a decide calea de urmat în situa Ńiile în care dintr-o stare anumită există mai multe c ăi de a tranzita într-o altă stare, ca urmare mai mult decât o singură regulă este posibil de a fi aplicată Alegerea unei strategii reprezintă cea de a 5-a preocupare în rezolvarea unei probleme de IA 79 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială 3 2 Exemple de formaliz ări Vom continua exemplificarea primelor patru precepte pentru rezolvarea unei probleme de IA, prezentate în sec Ńiunea precedentă, cu înc ă dou ă probleme, de asemenea bine-cunoscute 3 2 1 Maimu Ńa i banana O maimu Ńă este închis ă într-o cu că în care se mai află o banan ă atârnată de tavan la o în ălŃime la care maimu Ńa nu poate ajunge i, într-un colŃ, o cutie Dup ă un num ăr de încerc ări nereu ite de a apuca banana, maimu Ńa merge la cutie, o deplaseaz ă sub banan ă, se urc ă pe cutie i apuc ă banana Se cere s ă se formalizeze maniera de ra Ńionament a maimu Ńii ca un sistem de reguli de produc Ńie Cerin Ńa I Problem ă – instan Ńă de problem ă Distinc Ńia dintre problem ă i instan Ńă a ei este nesemnificativ ă în acest caz Sunt posibile slabe varia Ńii ale enun Ńului în care de exemplu se precizeaz ă poziŃiile iniŃiale relative ale obiectelor din cu că etc Cerin Ńa a II-a Aprecierea a ce reprezintă o stare i a spa Ńiului stărilor Dac ă ar fi s ă elimin ăm dintr-un film care ar derula ac Ńiunile maimu Ńii între situa Ńia în care ea se află într-un colŃ, cutia într-alt colŃ i banana e legată de tavan i situa Ńia în care maimu Ńa e urcată pe cutie, la verticala babanei i Ńine în mân ă banana, acele secven Ńe pe care nu le considerăm importante pentru a rămâne numai cu cadrele semnificative, am rămâne probabil cu urm ătoarea secven Ńă de “benzi desenate”: Figura 3 3: O secven Ńă de stări care rezolv ă problema maimu Ńii i a bananei 80 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială În afara acestor stări, care sunt evidente i absolut necesare în derularea filmului, dac ă am investiga alte posibile ipostaze ale maimu Ńii în tentativa ei de a ajunge la banan ă, am g ăsi, probabil, printre altele, i pe acestea: Figura 3 4: Stări posibile dar neinteresante MulŃimea tuturor acestor stări, fie c ă sunt ori nu pe drumul spre solu Ńie, formeaz ă mulŃimea stărilor problemei Simplitatea acestei probleme ne-ar putea determina s ă lăsăm la o parte acele stări care nu pot face parte dintr-o eventuală cale spre solu Ńie Acesta este unul din pericolele care pot face o solu Ńie inacceptabilă Nu trebuie s ă uităm c ă ceea ce facem noi este formalizarea unei probleme ce trebuie rezolvată de “cineva” care nu cunoa te solu Ńia sau cel pu Ńin, nu o cunoa te în maniera în care o cunoa tem noi Un inventar atent al tuturor situa Ńiilor în care ar putea s ă ajung ă un automat ce se mică în spa Ńiul dat trebuie întotdeauna făcut S ă nu amestec ăm cunoa terea noastră, ca fiin Ńe ra Ńionale, cu cea a ma inii care nu “tie” nimic în momentul în care începe s ă “descopere” solu Ńia Cerin Ńa a III-a Reprezentarea stărilor În reprezentarea stărilor va trebui s ă ne gândim care sunt aspectele care conteaz ă în scenele pe care le-am decelat ca semnificative pentru a reprezenta stări Uneori ceea ce conteaz ă sunt rela Ńiile dintre obiectele ori personajele con Ńinute în scene Este ceea ce se întâmplă în problema noastră: aici ne intereseaz ă rela Ńiile reciproce care există între maimu Ńă, cutie i banan ă Astfel maimu Ńa fa Ńă de cutie se poate afla: “la distan Ńă”, “lâng ă”, “pe” sau “sub”; cutia fa Ńă de banan ă se poate afla: “lateral” sau “sub”; maimu Ńă fa Ńă de banan ă se poate afla: “la distan Ńă” (adic ă la o distan Ńă de unde nu o poate apuca), “aproape” (adic ă la o distan Ńă de unde o poate apuca) sau “Ńinând-o” Desigur c ă dac ă avem codificare aceste rela Ńii, cele simetrice lor (respectiv dintre cutie i maimu Ńă, banan ă i cutie i banan ă i maimu Ńă), pot fi inferate imediat i deci nu mai trebuie codificate 81 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Urm ătoarele predicate devin astfel cele de care avem nevoie Rela Ńia Maimu Ńă – Cutie: MC-departe = Maimu Ńa se află departe de Cutie MC-lâng ă = Maimu Ńa se află lâng ă Cutie MC-pe = Maimu Ńa se afla pe Cutie MC-sub = Maimu Ńa de află sub Cutie Rela Ńia Cutie – Banan ă: CB-lateral = Cutia este a ezată lateral fa Ńă de Banan ă CB-sub = Cutia este a ezată sub Banan ă Rela Ńia Maimu Ńa – Banan ă: MB-departe = Maimu Ńa se află departe de Banan ă MB-aproape = Maimu Ńa se află aproape de Banan ă MB-Ńine = Maimu Ńa Ńine Banana Cu aceste predicate, descrierea stărilor problemei devine: Starea iniŃială: MC-departe, CB-lateral, MB-departe Starea finală: MC-pe, CB-sub, MB-Ńine Cerin Ńa a IV-a Reprezentarea regulilor Regulile reprezintă descrierea tranziŃiilor între stări Când proiectăm regulile, ca i în cazul reprezentării stărilor, ne punem problema s ă descriem toate tranziŃiile posibile, chiar i cele care nou ă, cu mintea noastră de fiin Ńe umane, ni se par absurde, ca de exemplu, urcarea maimu Ńei pe cutie într-un punct ce nu se află pe verticala bananei, împingerea ei pân ă într-un punct ce nu se află pe verticala bananei, urcarea cutiei deasupra capului ori coborârea maimu Ńei de pe cutia aflată la verticala bananei fără banan ă Trebuie s ă ne plas ăm în postura ma inii care nu tie solu Ńia, ci trebuie s-o g ăseasc ă singură Ca urmare trebuie s ă-i îng ăduim toate micările posibile în acest univers pe care l-am descris, urmând ca ea singură s ă evite acele micări ce sunt absurde sau inutile Urm ătoarele tranziŃii pot fi inventariate: • aflată departe de cutie, maimu Ńa de aproprie de cutie: apropie-MC; • aflată lâng ă cutie, maimu Ńa se dep ărteaz ă de cutie: dep ărteaz ă-MC; • aflată lâng ă cutie, maimu Ńă trage cutia sub banan ă: trage-sub-MCB; • aflată lâng ă cutie i sub banan ă, maimu Ńă trage cutia de sub banan ă: trage- lateral-MCB; • aflată lâng ă cutie, maimu Ńă se urc ă pe ea: urc ă-MC; • aflată pe cutie, maimu Ńa coboară de pe ea: coboar ă-MC; • aflată pe cutie, maimu Ńa se ridic ă pentru a se apropia de banan ă: apropie-MCB; 82 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială • aflată pe cutie i ridicată pentru a apuca banana, maimu Ńa se ghemuie te, dep ărtându-se de banan ă: dep ărteaz ă-MCB; • aflată lâng ă cutie, maimu Ńa îi urc ă cutia deasupra capului: urc ă-pe-cap-MC; • din postura în care maimu Ńă Ńine cutia deasupra capului, maimu Ńa îi d ă jos cutia de pe cap: coboar ă-de-pe-cap-MC; • aflată aproape de banan ă, maimu Ńa apuc ă banana: apuc ă-MB Vom conveni s ă exprim ăm regulile prin forma generală: dacă atunci tarea de plecare starea de sosire s Figura 3 5: O regulă În partea de condiŃii caracteriz ăm minimum de cuno tin Ńe necesare pentru a descrie starea în care dorim s ă se aplice regula Trebuie s ă ne imagin ăm o regulă ca i când n-ar fi aplicată de noi ci s-ar aplica singură atunci când g ăse te condiŃii favorabile, adic ă când starea curentă a sistemului satisface condiŃiile ei Partea de condiŃii nu con Ńine nicidecum o descriere exhaustiv ă a stării, ci numai a unei p ărŃi a ei, ceea ce este semnificativ pentru depistarea stării De exemplu, dac ă dorim ca o regulă s ă se aplice numai când maimu Ńa se află lâng ă cutie, în partea de condiŃii a regulii vom include numai predicatul MC-lâng ă, de i starea respectiv ă, de exemplu starea a doua din secven Ńa de mai sus, mai are în descrierea ei i predicatele MB- departe i CB-lateral Odată g ăsită starea în care se verific ă condiŃiile regulii, regula se aplic ă, ceea ce are ca rezultat efectuarea anumitor schimb ări în stare Schimb ările din stare sunt descrise în partea ei de ac Ńiuni Din nou, partea de ac Ńiuni a regulii nu descrie în întregime starea de sosire ci numai schimb ările care se produc în stare pentru a o face diferită de starea de plecare S ă mai observ ăm c ă starea de plecare din Figura 5 nu trebuie confundată cu starea iniŃială din formularea problemei, dup ă cum starea de sosire e altceva decât starea finală Orice pereche de dou ă stări, între care poate avea loc o tranziŃie, cuprinde o stare de plecare, respectiv una de sosire 83 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Iată exprim ările câtorva reguli: apropie-MC : dac ă {MC-departe} atunci TERGE{MC-departe}, ADAUG Ă{MC-lâng ă} depărteaz ă-MC : dac ă {MC-lâng ă} atunci TERGE{MC-lâng ă}, ADAUG Ă{MC-departe} trage-sub-MCB : dac ă {MC-lâng ă, CB-lateral} atunci TERGE {CB-lateral}, ADAUG Ă{CB-sub} trage-lateral-MCB : dac ă {MC-lâng ă, CB-sub} atunci TERGE {CB-sub}, ADAUG Ă{CB- lateral} urc ă-MC : dac ă {MC-lâng ă} atunci TERGE {MC-lâng ă}, ADAUG Ă{MC-pe} coboar ă-MC : dac ă {MC-pe} atunci TERGE {MC-pe}, ADAUG Ă{MC-lâng ă} apropie-MCB : dac ă {MC-pe, MB-distan Ńă , CB-sub} atunci TERGE {MB-distan Ńă }, ADAUG Ă{MB-aproape} urc ă-pe-cap-MC : dac ă {MC-lâng ă} atunci TERGE {MC-lâng ă}, ADAUG Ă{MC-sub} apuc ă-MB : dac ă {MB-aproape} atunci TERGE {MB-aproape}, ADAUG Ă{MB-Ńine} 3 2 2 Lumea cuburilor (blocurilor) Se consideră o stiv ă de cuburi, ca cea din Figura 6a Un bra Ń de robot poate efectua urm ătoarele micări: prinde un cub aflat deasupra unei stive sau deplaseaz ă un cub aflat în mână pentru a-l a eza fie pe mas ă, fie pe un alt cub care e liber deasupra Se cere s ă se formalizeze problema controlului bra Ńului pentru a aduce blocurile dintr-o configura Ńie iniŃială într-alta considerată finală, de exemplu cea din Figura 6b Nu este importantă distan Ńa dintre stive, ci doar ordinea blocurilor în stive Ca s ă Ńinem lucrurile simple, vom considera c ă pentru controlul bra Ńului, din situa Ńia în care acesta se află într-o anumită poziŃie, este suficient s ă se indice poziŃia urm ătoare a lui fără a ne preocupa de traiectorie, distan Ńe, accelerări ori decelerări – adic ă am ănunte ce apar în mod normal în probleme de control a robo Ńilor C B B A C A a starea iniŃială b starea finală Figura 3 6: Problema cuburilor 84 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială CerinŃa I Problem ă – instan Ńă de problem ă Dintre toate problemele posibile de mutare a unui num ăr oarecare de cuburi dintr-o configura Ńie iniŃială într-una finală, problema, a a cum a fost ea definită mai sus, prezintă instan Ńa caracterizată prin exact trei cuburi, o anumită configura Ńie a lor ce reprezintă starea iniŃială i o anumită configura Ńie ce define te starea finală (precizate în Figura 3 6) Este evident c ă în cadrul aceleia i probleme o mulŃime de alte instan Ńe de probleme pot fi definite Conturarea solu Ńiilor pentru toate acestea ar trebui îns ă s ă nu necesite eforturi suplimentare de programare celor necesare rezolv ării instan Ńei de fa Ńă, de exemplu Cerin Ńa a II-a Aprecierea a ce reprezintă o stare i a spa Ńiului stărilor Reflectând la ce anume trebuie s ă fie o stare în problema de fa Ńă, vom ajunge inevitabil la dilema: situa Ńiile în care bra Ńul Ńine un bloc trebuiesc considerate ca stări ori nu A le ignora înseamn ă a lăsa în inventarul stărilor numai poze ale stivelor, ignorând situa Ńiile intermediare în care bra Ńul Ńine un bloc S ă încerc ăm s ă analiz ăm cele dou ă posibilităŃ i Există dou ă situa Ńii care sunt semnificative înainte de ridicarea unui bloc: blocul se află pe mas ă sau blocul se află pe alt bloc Acelea i dou ă situa Ńii sunt semnificative dup ă lăsarea unui bloc Teoretic avem deci 2*2=4 combina Ńii posibile de micări: de pe mas ă pe mas ă, de pe mas ă pe un bloc, de pe un bloc pe mas ă i de pe un bloc pe un alt bloc A adar dac ă ignorăm posturile intermediare ale bra Ńului Ńinând blocul ce se transportă, această alegere a stărilor ne va duce la scrierea a patru reguli Dac ă dimpotriv ă lu ăm în considerare ca stări i situa Ńiile în care blocul de transportat este Ńinut în mâna robotului, vom avea micările: de pe mas ă în bra Ń, de pe bloc în braŃ, din bra Ń pe mas ă i din bra Ń pe alt bloc, adic ă tot patru reguli Rezultă c ă în acest caz, din punctul de vedere al num ărului de reguli ce vor trebui elaborate, nu e importantă alegerea pe care o facem Într-un caz general îns ă, în care num ărul stărilor de plecare i respectiv de destina Ńie (v Figura 5 pentru o reamintire a termenilor) ale micărilor ar fi m i n, am avea un num ăr de m*n reguli când ignorăm posturile intermediare, dar numai m+n când nu le ignorăm Este deci mai economic, în num ăr de reguli ce trebuie proiectate, s ă încerc ăm s ă facem o spargere mai fin ă a micărilor în componente prin considerarea unor stări intermediare, atunci când aceste componente se dovedesc a fi p ărŃi constitutive ale mai multor micări complexe O astfel de rafinare nu-i are îns ă rostul atunci când stările intermediare, astfel puse în eviden Ńă, nu se reg ăsesc în mai multe micări pentru c ă în loc de a mic ora num ărul total de reguli l- am m ări inutil Doar din considerentul de a adopta solu Ńia care duce în general la o reprezentare mai compactă, în rezolvarea dată mai jos op Ńiunea va fi de a considera ca stări intermediare i situa Ńiile în care blocuri se află în mâna robotului Invităm cititorul s ă construiasc ă o solu Ńie în care aceste stări intermediare sunt ascunse 85 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Cerin Ńa a III-a Reprezentarea stărilor Să privim starea iniŃială (v Figura 3 6a) i s ă încerc ăm s ă decidem care sunt elementele esen Ńiale în reprezentarea ei A a cum am convenit deja, ceea ce intereseaz ă într-o stare este ordinea blocurilor în stive (la un moment dat ar putea s ă apară mai multe) cât i starea bra Ńului, adic ă dac ă e liber sau dac ă dimpotriv ă Ńine un cub Avem mai multe posibilităŃ i de a defini ordinea blocurilor într-o stiv ă: • utilizând un vector de nume de blocuri i o conven Ńie asupra cap ătului stivei: (A, B, C) – cu semnifica Ńia, de exemplu, c ă blocul de pe mas ă este A, iar cel liber deasupra este C Reprezentarea aceasta (v Figura 3 7a) este economic ă i are avantajul c ă poate fi u or modificată pentru a descrie situa Ńia în care există mai mult decât o singură stiv ă Fiecare stiv ă poate fi definită printr-un predicat stiva Starea iniŃială devine { stiva(A, B, C)}, iar cea finală { stiva(C, B), stiva(A)}; • precizând prin nite predicate, s ă zicem peste i sub, vecinii pe care fiecare bloc îi are dedesubt i respectiv deasupra Cu această conven Ńie, starea iniŃială ar fi reprezentată prin setul de predicate: { peste(A, mas ă), sub(A, B), peste(B, A), sub(B, C), peste(C, B), sub(C, nil )}, unde mas ă i nil ar semnifica masa i respectiv lipsa unui bloc (v Figura 3 7b) Această solu Ńie are dezavantajul unei anumite redundan Ńe în reprezentare Într-adev ăr faptul că blocul B se află peste blocul A este precizat atât de predicatul sub(A, B) cât i de peste(B, A); • redundan Ńa din nota Ńia de mai sus sugereaz ă notarea numai a rela Ńiilor dintre blocurile vecine i dintre acestea i mas ă, precum i a blocurilor care sunt libere deasupra Cu predicatele peste i liber , starea iniŃială poate fi notată: {peste(A, mas ă), peste(B, A), peste(C, B), liber(C)}, iar cea finală: { peste(C, mas ă), peste(B, C), liber (B), peste(A, mas ă), liber (A)} (v Figura 7c) nil su b liber C peste C su b peste stiva B B peste supeste b A A peste peste C masmas ă AB ă a ordine definită b ordine definită prin c ordine definită prin global vecin ătăŃ i locale rela Ńii dintre obiecte Figura 3 7: PosibilităŃ i de reprezentare a a ez ării relative a blocurilor 86 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială În toate aceste cazuri mai trebuie ad ăugată cunoa terea asupra bra Ńului Dou ă sunt stările care caracterizeaz ă bra Ńul: bra Ńul este gol i bra Ńul Ńine blocul X (v Figura 3 8), adic ă predicatele: mâna-liber ă i respectiv mâna-Ńine(X) X a mâna-liber ă b mâna-Ńine(X) Figura 3 8: Reprezentarea configura Ńiilor mâinii Vom continua s ă investig ăm în paralel prima i ultima variantă Astfel pentru prima variantă vom avea: Starea iniŃială: { stiva(A, B, C), mâna-liber ă} Starea finală: { stiva(C, B), stiva(A), mâna-liber ă} iar pentru ultima variantă: Starea iniŃială: { peste(A, mas ă), peste(B, A), peste(C, B), liber (C), mâna-liber ă} Starea finală: { peste(C, mas ă), peste(B, C), liber (B), peste(A, mas ă), liber (A), mâna-liber ă} Cerin Ńa a IV-a Reprezentarea regulilor Cele patru tipuri de micări descoperite mai sus, în conven Ńia în care reprezentăm ca stări i situa Ńiile în care blocurile sunt Ńinute în mâna robotului, duc în mod direct la scrierea a patru reguli, în forma pe care am convenit-o deja în sec Ńiunea 3 1 4, adic ă: dac ă atunci , unde în partea dac ă vom descrie condiŃii pentru recunoa terea stărilor de plecare ale regulii, iar în partea atunci , vom descrie ac Ńiuni Aceste ac Ńiuni trebuie s ă specifice modific ările de realizat în starea de plecare pentru ca ea s ă se transforme în starea de sosire Ele vor consta din eliminarea unor predicate din descrierea stării de plecare i includerea altora, deci vor avea forma terge adaug ă În varianta din Figura 3 7a avem urm ătoarele reprezentări pentru reguli (v i Figura 3 9): ia-de-pe-bloc(X,Y) : dac ă {stiva(*, Y, X), mâna-liber ă} atunci TERGE{stiva(*, Y, X), mâna-liber ă} ADAUG Ă{stiva(*, Y), mâna-Ńine(X)} unde stiva(*, X, Y) semnific ă o stiv ă a c ărei parte de la baz ă este oarecare 87 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială ia-de-pe-mas ă(X) : dac ă {stiva(X), mâna-liber ă} atunci TERGE{stiva(X), mâna- liber ă} ADAUG Ă{mâna-Ńine(X)} pune-pe-bloc(X,Y) : dac ă {mâna-Ńine(X), stiva(*, Y)} atunci TERGE{mâna-Ńine(X), stiva(*, Y)} ADAUG Ă{stiva(*, Y, X), mâna-liber ă} pune-pe-mas ă(X) : dac ă {mâna-Ńine(X)} atunci TERGE{mâna-Ńine(X)} ADAUG Ă{stiva(X), mâna-liber ă} iar pentru varianta de reprezentare din Figura 7c, urm ătoarele reguli: ia-de-pe-bloc(X,Y) : dac ă {peste(X, Y), liber(X), mâna-liber ă} atunci TERGE{peste(X, Y), liber(X), mâna-liber ă} ADAUG Ă{liber(Y), mâna-Ńine(X)} ia-de-pe-mas ă(X) : dac ă {peste(X, mas ă), liber(X), mâna-liber ă} atunci TERGE{peste(X, mas ă), liber(X), mâna-liber ă} ADAUG Ă{mâna-Ńine(X)} pune-pe-bloc(X,Y) : dac ă {mâna-Ńine(X), liber(Y)} atunci TERGE{mâna-Ńine(X), liber(Y)} ADAUG Ă{peste(X, Y), liber(X), mâna-liber ă} pune-pe-mas ă(X) : dac ă {mâna-Ńine(X)} atunci TERGE{mâna-Ńine(X)} ADAUG Ă{peste(X, mas ă), liber(X), mâna-liber ă} ia-de-pe-bloc(X,Y) X X Y Y * * pune-pe-bloc(X,Y) ia-de-pe-mas ă(X) X X pune-pe-mas ă(X) Figura 3 9: Regulile 88 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială 3 3 Controlul sistemelor de produc Ńie 3 3 1 Strategii irevocabile O strategie irevocabilă este una în care orice micare în spa Ńiul stărilor este ireversibilă Cale de întoarcere nu există O strategie irevocabilă aparent merge la sigur Dar imposibilitatea de a mai continua la un moment dat duce, inevitabil, la oprirea c ăutării i deci e ec Este ca i cum a cunoa te deja solu Ńia i atunci m ă îndrept direct spre ea Dar ce sens mai are c ăutarea dac ă cunosc deja solu Ńia? Distinc Ńia provine din gradul de cunoa tere a solu Ńiei problemei: cunoa tere globală (imagina Ńi-vă g ăsirea drumului într-un labirint privit dintr-un balon) fa Ńă de cunoa tere locală (labirintul privit de un om aflat în el) Un sistem de IA care lucreaz ă cu o strategie irevocabilă are o cunoa tere locală a problemei, al aplicând o manieră generală de comportament în toate situa Ńiile similare • Metoda ascensiunii ( hill climbing) Numele metodei este dat de analogia cu maniera de căŃărare pe un deal a unui orb El nu e capabil s ă vad ă vârful dealului unde trebuie s ă ajung ă dar poate găsi în orice moment, încercând la fiecare pas în jurul lui cu bastonul, direc Ńia care-l face s ă urce (Figura 3 10) Metoda ascensională caută s ă ating ă starea caracterizată de valoarea maxim ă a func Ńiei euristice Ea nu garanteaz ă g ăsirea unei solu Ńii din cauz ă c ă anumite probleme pot avea maxime locale sau platouri, dup ă cum se sugereaz ă în Figura 3 11 Figura 3 10: Metoda Hill-climbing Figura 3 11: Maximele locale, iar uneori i platourile, opresc înaintarea spre solu Ńie 89 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială procedure hill-climbing( initial-state ) begin current-state , stack ); recGetPathDepthFirstSearch( stack ); end Diferen Ńele acestei variante de c ăutare întâi-în-adâncime fa Ńă de precedenta sunt urm ătoarele: - elementele stivei sunt acum formate din pereche de genul , unde nod este un nod al arborelui, iar cale este o secven Ńă de noduri, configurând o solu Ńie parŃială, între rădăcin ă i nod; - singurul apel recursiv al func Ńiei se detaliaz ă acum în dou ă apeluri pentru c ă trebuie făcută diferen Ńa între cazurile în care nodul curent are ori nu descenden Ńi Dac ă el nu are descenden Ńi ( succ == Æ), atunci calea nu se 101 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială modific ă, pentru c ă practic stiva reculeaz ă cu nodul curent, ce fusese scos prin opera Ńia pop Dac ă are descenden Ńi, atunci în stiv ă se includ perechi formate din fiecare nod descendent i calea corespunz ătoare la care se adaug ă nodul descendent (prelungirea c ăii vechi cu nodul nou este notată path ° n, pentru a sugera o concatenare); - valoarea întoars ă este, de data asta, o cale iar nu un simplu nod Apelul iniŃial trebuie acum s ă fie de forma: recGetPathDepthFirstSearch(push ,Æ) În aceea i manieră, func Ńia de c ăutare întâi-în-lărgime devine: procedure recGetPathBreadthFirstSearch( queue ) begin if empty( queue ) then return FAIL; ( node ,path ) , queue )); end cu apelul iniŃial recGetPathBreadthFirstSearch(in ,Æ) În fine, varianta ce se preocup ă de generarea solu Ńiei pentru func Ńia de c ăutare cel- mai-bun-întâi devine: procedure recGetPathBestFirstSearch( list ) begin if empty( list ) then return FAIL; ( node ,path ) , list ); recGetPathBestFirstSearch(sort(list)); end al c ărei apel iniŃial trebuie s ă fie exprimat ca: recGetPathBestFirstSearch(include ,Æ) În această variantă a procedurii de c ăutare cel-mai-bun-întâi, se presupune c ă func Ńia sort sorteaz ă perechi pe baza strict a scorurilor nodurilor, deci fără a se preocupa de c ăile ata ate - Recuperarea solu Ńiei în metodele de c ăutare euristic ă pe grafuri Algoritmul A* Mai avem de rezolvat o problem ă, i anume, cum se face recuperarea c ăii atunci când structura e un graf iar nu un arbore Problema revine la calculul drumurilor de cost minim în grafuri, considerată o problem ă clasic ă de c ăutare în grafuri, dar, în acela i timp, i o problem ă de IA În general, în problemele de acest 102 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială gen, aprecierea costurilor este făcută de o func Ńie euristic ă f care exprim ă costul ca o sum ă a dou ă valori: g – un cost al travers ării grafului din nodul start pân ă în nodul curent, i h – un cost al estim ării travers ării grafului din nodul curent pân ă într-un nod final: f = g + h Toate valorile func Ńiilor g i h trebuie s ă fie pozitive Evident c ă precizia func Ńiei euristice reflectă cantitatea de informa Ńie pe care ea o incorporeaz ă relativ la domeniul problemei O func Ńie h identic nulă reflectă lips ă totală de informa Ńie asupra problemei (cazul în care nu se poate face nici o estimare asupra aproprierii de solu Ńie a unei stări) Urm ătoarea procedură este o variantă a c ăutării best-first , cunoscută sub numele de algoritmul A (Hart, et al , 1968) Procedura genereaz ă atât o parte a grafului stărilor problemei cât i un subset al s ău numit arbore de c ăutare (a adar, în care fiecare nod are un unic p ărinte) La fiecare pas al itera Ńiei exterioare, nodurile din open reprezintă noduri frunz ă ale arborelui de c ăutare În derularea algoritmului, nu numai c ă arborele de c ăutare se extinde în graful generat dar îi poate schimba i forma în aa fel încât unele noduri îi modific ă p ărin Ńii Când o frunz ă a arborelui de c ăutare atinge un nod final, atunci c ăutarea se termin ă i pentru c ă fiecare nod al acestui arbore îi cunoa te p ărintele, solu Ńia este dată de calea invers ă de la nodul final la nodul de start procedure A( start-node ) begin start-node back-score = 0; s tart-node forth-score = euristics( start-node ); /* Presupunem c ă ata ă m fiec ărui nod trei fa Ńete: /* back-score – costul c ăii de la r ădăcin ă la nod; /* forth-score – aprecierea costului de la nod la destina Ńie; /* father – nodul lui p ărinte în drumul spre solu Ńie open 2) Asta înseamn ă c ă drumul pân ă la G ca A-B-C-F-G este mai lung decât cel g ăsit anterior ca A-B-G Din acest motiv p ărintele nodului G nu se schimb ă Să lu ăm îns ă exemplul grafului din Figura 3 19 i s ă considerăm c ă, dintr-un motiv oarecare, func Ńia euristic ă pe care o avem la dispoziŃie apreciaz ă ca forth- score pentru nodurile F i J valoarea 20, valorile tuturor celorlalte noduri fiind 10 Atunci evolu Ńia algoritmului ar fi dată de Tabelul 3 3 1 2 3 5 A B C D 0 1 2 3 Pa ii 1-8 a 6 4 F E G2 3 4 8 7 K J I H 6 5 7 A B C D 1 2 3 0 b Pa ii 9-11 9 G F E 2 3 4 11 0 1 K J I H 5 5 4 6 6 7 Figura 3 19: Un spa Ńiu al stărilor reprezentat ca graf în care arborele de c ăutare evolueaz ă cu reveniri 106 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Tabelul 3 3: Derularea algoritmului în caz de revenire asupra deciziilor (pe spa Ńiul stărilor din Figura 3 19) Pas current-node pairs :{(node ,score )} open closed 0 (A) Æ 1 A ((B,1)) (B) (A) (A f=nil, A bs=o, A fs=7) B f=A, B bs=1, B fs=10 2 B ((C,1),(G,1)) (C,G) (A,B) C f=B, C bs=2, C fs=10 sortată: G f=B, G bs=2, G fs=10 (C,G) 3 C ((D,1),(F,1)) (G,D,F) (A,B,C) D f=C, D bs=3, D fs=10 sortată: F f=C, F bs=3, F fs=20 (G,D,F) 4 G () (D,F) (A,B,C,G) sortată: (D,F) 5 D ((E,1)) (F,E) (A,B,C,G,D) E f=D, E bs=4, E fs=10 sortată: (E,F) 6 E ((F,1),(H,1)) (F,H) (A,B,C,G,D,E) H f=E, H bs=5, H fs=10 sortată: (H, F) 7 H ((I,1)) (F,I) (A,B,C,G,D,E,H) I f=H, I bs=6, I fs=10 sortată: (I,F) 8 I ((J,1)) (F,J) (A,B,C,G,D,E,H,I J f=I, J bs=7, J fs=20 sortată: ) (F,J) 9 F ((G,1)(I,1)) (J) (A,B,C,G,D,E,H,I I f=F, I bs=4, I fs=10 ,F) updateDescScores(I) J f=I, J bs=5 10 J ((K,1)) (K) (A,B,C,G,D,E,H,I K f=J, K bs=6, K fs=10 ,F,J) 11 K – goal(K)=TRUE () () (A,B,C,G,D,E,H,I ,F,J,K) 107 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială În Figura 3 19a se prezintă pa ii 1-8 Datorită valorii mare a func Ńiei euristice nodul F a fost ocolit în parcurgere, fiind trecut la fiecare sortare a listei open în coada ei (pa ii 3-7) În Figura 3 19b sunt da Ńi pa ii 9-11 În momentul în care nodul F devine nod curent are loc o rearanjare a valorii de back-score a nodului I, descendent al lui F i valoarea acestuia este corectată de la 6 la 4 Această rea ezare poate influen Ńa toate nodurile ce pot fi atinse din F i care fuseseră deja calculate Apelul func Ńiei updateDescScores(I) realizeaz ă acest lucru Ca urmare i valoarea nodului J se modific ă de la 7 la 5 Să observ ăm c ă dac ă ceea ce intereseaz ă e numai g ăsirea unei c ăi spre solu Ńie, atunci putem face g( n)=0 în fiecare nod n Dup ă cum am v ăzut în cele dou ă exemple de mai sus, dac ă dorim cea mai scurtă cale spre solu Ńie, atunci g( n)=nr de pa i pân ă în n (costul unei c ăi = 1) i rezultatul e similar unei c ăutări breadth-first Dac ă fiecare operator are un alt cost, i se dore te cea mai ieftin ă cale, atunci g poate oglindi costul c ăii Dac ă algoritmul A folose te o func Ńie euristic ă h care este o limită inferioară a costului c ăii optime de la un nod n la Ńintă, atunci el se nume te A* Urm ătoarele rezultate se cunosc despre A* (v Nilsson, 1980): • A* se termin ă întotdeauna în grafuri finite; • dac ă o cale există de la nodul start la o solu Ńie, atunci A* se termin ă (chiar dac ă graful e infinit); • A* e admisibil (adic ă, dac ă există o cale de la nodul de start la un nod solu Ńie, A* g ăse te o cale optim ă) Spunem c ă un algoritm A2 e mai informat decât A1, dac ă, pentru toate nodurile n diferite de solu Ńie, h2(n) > h1(n) • Dac ă A1 i A2 sunt dou ă versiuni ale lui A*, astfel încât A2 e mai informat decât A1, atunci la terminarea c ăutărilor lor pe orice graf în care există o cale de la nodul start la un nod solu Ńie, orice nod expandat de A2 este de asemenea expandat i de A1 Urmeaz ă c ă A1 expandeaz ă cel pu Ńin tot atâtea noduri ca i A2 3 4 Sisteme Expert 3 4 1 Tipuri de c ăutări Am v ăzut în acest capitol câteva metode de a organiza o c ăutare în spa Ńiul stărilor pentru g ăsirea solu Ńiei unei probleme de IA Maniera de c ăutare a fost întotdeauna dinspre o stare considerată iniŃială c ătre o stare considerată finală, fie că tim cu exactitate acea stare, fie c ă o cunoa tem doar prin anumite condiŃii care sunt verificate de ea Parcurgerea spa Ńiului stărilor este deci întotdeauna “c ătre înainte” ( forward-looking), sau plecând de la premize pentru a ajunge la o concluzie Dar aceasta nu e singura posibilitate: la fel de bine putem adopta o manieră de căutare care pleac ă dinspre concluzie pentru a verifica dac ă avem premize care s-o verifice Maniera se nume te “c ăutare înapoi” ( backward-looking) Limbajul Prolog implementeaz ă o astfel de strategie In sfârit se poate vorbi i de o c ăutare bidirec Ńională, în care se pleac ă simultan dinspre premize i concluzie în încercarea de a g ăsi o cale care s ă le uneasc ă 108 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială 3 4 2 Sistemele Expert (SE) Un Sistem Expert este un program capabil de a încorpora i folosi cuno tin Ńe echivalente cu cele pe care le are un expert uman într-un anumit domeniu Un shell (sau o “carapace”) de SE este ceea ce ar rămâne dintr-un SE dac ă l-am goli de cunoa terea expert El este, a adar, un sistem de control capabil de a efectua o căutare într-un spa Ńiu al stărilor, de aceea se mai nume te i motor de inferen Ńe Premiza principală în construc Ńia unui SE este aceea c ă un expert îi construie te solu Ńia la o problem ă din piese elementare de cunoa tere pe care le selecteaz ă i le aplic ă într-o anumită secven Ńă Pentru a furniza o solu Ńie coerentă la o problem ă dată cunoa terea cuprins ă într-un anumit domeniu trebuie a adar formalizată, apoi reprezentată corespunz ător i în final manipulată în conformitate cu o anumită metod ă de rezolvare de probleme Se pune astfel în evidenŃă diviziunea dintre sec Ńiunea care p ăstreaz ă reprezentarea cunoa terii asupra domeniului – baza de cuno tin Ńe, formată dintr-o colec Ńie (baz ă) de fapte împreun ă cu o colec Ńie (baz ă) de reguli i diviziunea responsabilă cu organizarea proceselor inferen Ńiale care s ă implice aceste cuno tin Ńe – sistemul de control Un shell foarte cunoscut de SE este CLIPS (Giarratano, Riley, 1998) 3 5 Concluzie Rezolvarea unei probleme de IA are dou ă aspecte: • formalizarea problemei = g ăsirea unei reprezentări pentru stările problemei i găsirea unei reprezentări pentru reguli; • lansarea unei c ăutări în spa Ńiul stărilor în scopul determin ării unei c ăi între starea considerată iniŃială i o stare finală Când un astfel de drum nu poate fi g ăsit spunem c ă problema nu are solu Ńie Aceste concluzii pun în eviden Ńă i preocup ările majore ale domeniului: găsirea celor mai adecvate procedee de reprezentarea a problemelor, respectiv găsirea celor mai eficiente procedee de navigare în spa Ńii ale stărilor Cerin Ńe pentru studen Ńi: • Să recunoasc ă încadrarea unei probleme în clasa de probleme IA • Să deosebeasc ă o problem ă de o ipostaz ă de problem ă • Să identifice spa Ńiul stărilor problemei i s ă-i aprecieze m ărimea • Să construiasc ă o reprezentare adecvată a stărilor • Să identifice regulile i s ă construiasc ă o reprezentare neformală a lor • Să hotărasc ă asupra unui tip de c ăutare a solu Ńiei • Să poată adapta algoritmul la cerin Ńele particulare ale problemei 109 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Probleme P3 1 Recuperarea solu Ńiei: s ă se modifice algoritmii hill-climbing() i rec-hill- climbing() din sec Ńiunea 3 3 1 pentru a-i face s ă întoarc ă: a) o secven Ńă de stări prin care se trece în drumul de la starea iniŃială pân ă la cea finală; b) o secven Ńă de operatori care aplica Ńi stării iniŃiale s ă duc ă la ob Ńinerea stării finale P3 2 Acelea i cerin Ńe pentru algoritmii backtracking-hill-climbing() i rec- backtracking-hill-climbing() din sec Ńiunea 3 3 2 P3 3 S ă se figureze un arbore a solu Ńiei pentru instan Ńa problemei cuburilor dată în Figura 3 20, în care func Ńia euristic ă adaug ă, pentru fiecare bloc, 1 – dac ă stă pe blocul pe care ar trebui s ă ajung ă i scade 1 – dac ă nu stă pe blocul pe care ar trebui s ă ajung ă Operatorii sunt cei cunoscu Ńi din sec Ńiunea 3 2 2 A E D E C D C B B A a starea iniŃială b starea finală Figura 3 20: O instan Ńă a problemei cuburilor cu cinci piese P3 4 S ă se descrie func Ńia updateDescScores(node) din componen Ńa algoritmului A (v sec Ńiunea 3 3 2) P3 5 S ă se descrie func Ńia generatePath( current-node, start-node) din componen Ńa algoritmului A (v sec Ńiunea 3 3 2) P3 6 Se d ă o gramatic ă independentă de context i o fraz ă a) S ă se precizeze diferen Ńa dintre o problem ă i o instan Ńă de problem ă în acest caz b) S ă se dea exemple de alte instan Ńe ale aceleia i probleme c) S ă se explice ce înseamn ă o stare în rezolvarea acestei probleme i care e reprezentarea unei stări d) S ă se formalizeze ca o problem ă de c ăutare în spa Ńiul stărilor problema recunoa terii dac ă fraza face parte din limbajul generat de gramatic ă e) Ce strategie considera Ńi adecvată pentru rezolvare? f) S ă se dea exemple de dou ă solu Ńii posibile (deriv ări) Exemplu pentru: G = {NT, T, S, P}, unde: NT = {S, NP, VP, N, V} T = { calul , lacrim ă, duce}, iar 110 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială P = {S NP VP, NP NP NP, NP N, VP V NP, VP V, N calul , N lacrim ă, N duce, V duce, V lacrim ă} i propoziŃia: " calul duce lacrim ă" P3 7 În testele de inteligen Ńă apar probleme în care este dată o secven Ńă de numere i se cere s ă se g ăseasc ă formula prin care se determin ă succesorul Vi se cere s ă rezolva Ńi prin mijloace specifice IA o astfel de problem ă Descrie Ńi un algoritm care s ă g ăseasc ă o solu Ńie a unei astfel de probleme, presupunând existen Ńa unei proceduri stripsSearch( n1 ,n2), unde n1 i n2 sînt dou ă numere din secven Ńă Procedura stripsSearch() realizeaz ă o căutare într-un spa Ńiu al stărilor în care n1 este o stare iniŃială iar n2 – una finală, c ăutând o cale de aplica Ńii de reguli O regulă în această formalizare transform ă un num ăr într-un alt num ăr Procedura stripsSearch() întoarce o listă de secven Ńe de reguli Num ărul de aplica Ńii ale procedurii stripsSearch() este dat de num ărul de secven Ńe consecutive de dou ă numere ce se cuprind în secven Ńa originală Dup ă fiecare apel al procedurii stripsSearch() num ărul de secven Ńe de reguli rămas trebuie s ă fie mai mic sau cel mult egal cu cel anterior În mod ideal, la terminarea acestei faze, o singură cale trebuie s ă rămân ă Solu Ńia problemei va trebui dată de aplicarea c ăii asupra ultimului num ăr din secven Ńa dată P3 8 Pentru a controla explozia exponen Ńială care poate s ă apară în anumite probleme de investigare a spa Ńiului stărilor, se recurge la o îngrădire a listei nodurilor ce vor fi exploatate, re Ńinând la fiecare pas primii N cei mai promiŃători candida Ńi Varianta se nume te beam- search Descrie Ńi un astfel de algoritm de c ăutare pe arbori P3 9 S ă se g ăseasc ă o reprezentare adecvată pentru o stare în jocul de ah i apoi s ă se modeleze mutările calului i ale nebunului P3 10 a) Descrie Ńi în Lisp regula M-right prin care un singur misionar se deplaseaz ă pe malul din dreapta Forma generală a regulii trebuie s ă fie: if CONDIłII then AC łIUNI ; b) Descrie Ńi o func Ńie de scor pentru problema canibalilor i misionarilor; c) Poate problema misionarilor i canibalilor s ă aib ă o rezolvare printr-un algoritm de tip hill- climbing? Explica Ńi P3 11 S ă se formalizeze ca o problem ă de c ăutare în spa Ńiul stărilor urm ătoarea problem ă de aliniere: se dau dou ă semnale, fiecare fiind format dintr-o secven Ńă de segmente de linie dreaptă aflate unul în prelungirea celuilalt (ca în Figura 3 21) Fiecare segment e caracterizat de o lungime (pe axa orizontală) i o pantă Se dore te s ă se ob Ńine cea mai bun ă aliniere între cele dou ă semnale În evaluarea unei alinieri conteaz ă lungimea segmentelor i panta acestora Figura 3 21: Alinierea a dou ă semnale codificate ca secven Ńe de linii frânte P3 12 Se consideră un joc ce se desfăoară pe o tabla 3 × 3 pe care sunt plasate piese albe i negre (Figura 3 22) Fiecare dintre cei doi juc ători are asignată câte o culoare La o mutare, un juc ător poate selecta un dreptunghi, piesele din interiorul dreptunghiului urmând să-i schimbe culoarea Câ tig ă primul juc ător care ob Ńine pe tablă toate piesele în culoarea lui 111 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Figura 3 22: O secven Ńă de trei mutări în evolu Ńia jocului a) S ă se propun ă un set de predicate care s ă fac ă posibilă descrierea stărilor jocului Cu ele s ă se defineasc ă starea iniŃială (figura din stânga) i starea finală b) S ă se propun ă reguli pentru modelarea micărilor juc ătorilor c) S ă se propun ă o func Ńie de evaluare a unei stări i un algoritm de control P3 13 Se d ă o tablă de ah pe care se g ăsesc iniŃial plasa Ńi cai Ei se deplaseaz ă, utilizând salturile caracteristice calului din jocul de ah, întotdeauna spre hambar (colŃul din stânga sus al tablei) Micările se termina când unul din cai reu ete s ă ajung ă în hambar a) S ă se propun ă un set de predicate care s ă fie utilizate în reprezentarea unei stări i, cu ajutorul lor, s ă se descrie o stare iniŃială b) S ă se descrie un set de reguli care s ă realizeze mutările cailor c) S ă se descrie o secven Ńă de mutări care s ă conduc ă spre solu Ńie P3 14 Doi parteneri, A i B, stau fa Ńă în fa Ńă: B i-a pus în minte un num ăr între 1 i 10 pe care A trebuie s ă-l ghiceasc ă A propune numere iar B răspunde prin “da”, “mai mic” sau “mai mare” a) Formula Ńi acest dialog ca o problem ă IA b) Descrie Ńi secven Ńa de reguli aplicate i de stări generate când B alege num ărul 7 P3 15 Într-un joc pe calculator intervin urm ătoarele elemente: • un omule Ń, care este un obiect u or dar dur, se poate mica în toate direc Ńiile, poate împinge obiecte i mânca inimioare, când se află lâng ă acestea; • dou ă bile, care sînt obiecte dure i grele; • bomb ă, care poate exploda dac ă un obiect dur cade peste ea sau dac ă ea cade peste un obiect dur, caz în care se autodistruge i distruge orice obiect aflat în imediata apropiere; • inimioară, care este un obiect dur i greu; • cinci parcele de pajite care sînt obiecte moi ce se distrug la trecerea omule Ńului; • un balon, care poate în ălŃa un singur obiect greu dar care e sus Ńinut de pajite; • uă, care se deschide când omule Ńul a mâncat inimioara Figura 3 23: Starea iniŃială a jocului Un obiect greu poate c ădea atunci când nu e sus Ńinut Un obiect u or nu cade a) S ă se imagineze un set de predicate cu ajutorul c ărora s ă se reprezinte starea din Figura 3 23 b) S ă se descrie ac Ńiunile posibile din acest mic univers ca un set de reguli de produc Ńie c) S ă se imagineze secven Ńa de aplic ări de reguli prin care omule Ńul poate ie i prin u ă P3 16 Descrie Ńi într-un eseu elementele de inteligen Ńă artificială pe care vi le imagina Ńi incorporate în casa viitorului (max 2 pagini) Da Ńi cît mai multe indica Ńii de modelare 112 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială P3 17 Ceea ce urmeaz ă reprezintă formularea unui joc numit Lives i atribuit matematicianului John Conway de la Univ Cambridge: Există a tablă p ătrată (presupus infinită) pe care se pot dezvolta celule Fiecare poziŃie de pe tablă poate evolua în func Ńie de starea ei i a celor opt vecini ai s ăi conform a trei reguli: 1 Supravie Ńuire Orice celulă vie care se învecineaz ă cu dou ă sau trei alte celule vii supravie Ńuie te 2 Moarte Orice celulă vie care se învecineaz ă cu patru sau mai multe celule vii moare de suprapopulare Orice celulă vie care se învecineaz ă cu una sau nici o celulă vie moare de izolare 3 Na tere În orice loca Ńie goală care se învecineaz ă cu exact trei celule vii va apare o celulă vie Toate regulile se calculeaz ă întâi pentru fiecare celulă i se aplic ă odată pentru a da na tere la urm ătoarea genera Ńie a tablei Într-o anumită implementare a jocului prin reguli de produc Ńie, s-a preferat o reprezentare în care pentru fiecare loca Ńie de coordonate ( x, y) a tablei se cunosc, la orice moment, urm ătoarele predicate: • current-value( x,y,v) – cu semnifica Ńia c ă valoarea curentă a loca Ńiei este v Î{empty, cell}; • new-value( x,y,v) – cu semnifica Ńia c ă valoarea la genera Ńia urm ătoare a loca Ńiei trebuie s ă fie v Î{empty, cell}; • neighbour( x,y,n) – cu semnifica Ńia c ă num ărul de celule vii învecinate loca Ńiei este n (0£n£8); • tested( x,y,t) – cu semnifica Ńia c ă loca Ńia este deja calculată pentru noua genera Ńie ( t = true), ori nu ( t = false) - Descrie Ńi un set de operatori care guverneaz ă evolu Ńia simulată a jocului Preciza Ńi mecanismele suplimentare de control i reprezentare de care ave Ńi nevoie pentru secven Ńierea fazelor; - Descrie Ńi prin setul de predicate precizat anterior urm ătoarea • • • stare iniŃială: Figura 3 24: Starea iniŃială a jocului LIFE - Descrie Ńi o secven Ńă de reguli care produc dou ă genera Ńii de celule plecând de la starea iniŃială precizată i arăta Ńi care va fi configura Ńia ultimei genera Ńii din cele dou ă Bibliografie Cristea, D 2002 Programarea bazată pe reguli Ed Academiei, Bucure ti 113 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Giarratano, J Riley, G 1998 Expert Systems: Principles and Programming, 3rd Edition, PWS Publishing Hart, P E , Nilsson, N J , Raphael, B 1968 A Formal Basis for the Heuristic Determination of Minimum Cost Paths IEEE Transactions on Systems Science and Cybernetics, Vol 4, No 2, 1968, pp 100-107 Nilson,N 1980 Principles of Artificial Intelligence Morgan Kaufmann 114 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Capitolul 4 Reprezentarea cunoa terii i ra Ńionament Bine, atunci: care e viteza întunericului? Wright Stevens Realitatea este tot ceea ce ne înconjoară La baza interac Ńiunii noastre, ca sisteme vii, cu realitatea stau necesităŃ ile i dorin Ńele noastre Credem c ă sediul acestor imbolduri este creierul nostru i tot acolo realitatea trebuie s ă fie reflectată într-un anume fel La mas ă fiind, întindem mâna dup ă solniŃă, o apuc ăm i o scuturăm deasupra grătarului de vită din farfurie, dup ă care o a ez ăm la loc Facem toate acestea mai întâi pentru c ă „ne place” mâncarea mai s ărată i apoi pentru c ă „vrem” s ă ne satisfacem acest gust Apoi „tim” c ă sarea se află în solniŃă, c ă o putem face s ă ias ă din solniŃă i pres ăra peste mâncare prin scuturare deasupra ei, că pentru a aduce solniŃa deasupra farfuriei trebuie s ă o apuc ăm cu mâna, s ă o răsturn ăm deasupra farfuriei i s ă o scuturăm, dup ă care, în mod normal, trebuie s ă o repunem pe mas ă de unde am luat-o Suntem apoi capabili s ă „recunoa tem” solniŃa undeva pe mas ă În fine putem s ă “controlăm” micările mâinii, întâi îndreptând-o spre locul unde se află solniŃa, apoi deschizând palma ca pentru a apuca între degete, apoi apucând solniŃa cu mâna, retrăgând-o pân ă solniŃa ajunge deasupra farfuriei, întorcând mâna i scuturând-o atât cât “credem” c ă ne trebuie sare i făcând apoi toate micările în sens invers pentru a depune înapoi solniŃa pe mas ă de unde am luat-o Toate aceste ac Ńiuni sunt atât de banale încât le facem purtând un dialog cu partenerul de mas ă despre un subiect care nu are nimic în comun cu condimentarea fripturii din fa Ńa noastră, reflex, aproape fără s ă ne concentrăm la ceea ce facem Dar toate ghilimelele din paragraful de mai sus, comportă acte i stări cognitive, care compun un tablou extrem de spectaculos Dac ă ar trebui s ă-l detaliem, am recunoa te urm ătoarele componente: • realitatea, adic ă noi, masa, solniŃa, sarea, farfuria, friptura etc , este formată din obiecte care sunt independente unele de altele Acestea se supun legilor fizicii, de exemplu ocup ă locuri în spa Ńiu, nu e posibil ca dou ă dintre ele s ă se afle în acela i loc în acela i moment i sunt grele, adic ă cad dac ă nu sunt sprijinite de un suport Datorită unui complex de împrejurări oarecare, acestea se g ăsesc toate într-o vecin ătate uman sesizabilă, la momentul desfăurării scenei; • noi avem plăceri, dorin Ńe, nevoi Aceste stări de spirit sunt motoarele ac Ńiunilor pe care le iniŃiem F ără ele am ad ăsta, inerŃi ca nite legume, ca vântul s ă ne mute i ploaia s ă ne ude; • noi avem cuno tin Ńe despre foarte multe lucruri, printre altele i despre ceea ce este normal s ă existe i s ă se întâmple în realitate Aceste cuno tin Ńe reprezintă o memorie a lucrurilor v ăzute, povestite ori citite De exemplu putem g ăzdui în această memorie rela Ńii între obiecte care se 115 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială află în câmpul nostru vizual i altele care nu se află acolo Astfel, ”tim” că, în mod normal, sarea se află în solniŃă, mai ”tim” cum arată o solniŃă, adic ă care e forma ei, i ”tim” c ă sarea e s ărată, adic ă are acel gust care dorim s ă-l completeze pe cel al fripturii În acela i timp cunoa tem ac Ńiunea de ”a pune sare în mâncare la mas ă” pentru c ă am repetat-o de atâtea ori pân ă acum Dac ă nu am avea această cunoa tere, înc ă ar fi posibil s ă ne satisfacem nevoia de sare (de i autorul nu o recomand ă cu prea aprins ă c ăldură cititorilor s ăi), pentru c ă, înzestra Ńi cu inteligen Ńă cum ne aflăm, am putea corela anume cuno tin Ńe pentru a rezolva pentru prima oară această problem ă, eventual din câteva încerc ări Cu alte cuvinte o experien Ńă de acest tip, trăită, primită ori descoperită, este evocată în memoria noastră ca solu Ńia la nevoia de a avea friptura s ărată; • rezultatul va fi construirea unui plan care s ă particularizeze cunoa terea de natură generală, la detaliile mesei i aranjării obiectelor aflate în fa Ńa noastră În particularizarea planului, crucială este ”recunoa terea” solniŃei pe mas ă, de i este pentru prima oară când vedem această solniŃă anume Reu im s ă identific ăm solniŃa pe mas ă pentru c ă ea seam ănă atât de mult cu forma pe care tim c ă ar trebui s ă o aib ă o solniŃă Dac ă, din obscure motive, solniŃa de pe masa noastră ar avea forma i dimensiunile unei mingi de baschet, e greu de crezut c ă am reu i s ă o identific ăm; • în fine, planul este pus în aplicare, creierul comand ă mâinii secven Ńa tuturor acelor micări i urm ăre te realizarea lui, controlând permanent poziŃia mâinii cu imaginea primită în ochi Dac ă, dup ă ce am localizat solniŃa pe mas ă, am încerca s ă ne ducem la îndeplinire planul cu ochii închii, am avea mari anse s ă apuc ăm în locul solniŃei piperul pe care să-l scuturăm în paharul cu vin Esen Ńială în acest scenariu este reprezentarea realităŃ ii în memoria noastră Fără această reprezentare, nu am recunoa te situa Ńia drept una deja întâlnită, nu am putea particulariza secven Ńa de ac Ńiuni la realităŃ ile locului pentru a construi un plan i prin urmare am rămâne cu friptura nes ărată În acest capitol vom trece în revistă câteva tipuri de reprezentări ce se aplic ă sistemelor de IA 4 1 Ontologii În filosofie, cuvântul „ontologie” desemneaz ă un punct de vedere sistematic asupra Existen Ńei El este împrumutat de IA unde este utilizat cu semnifica Ńia de specificare a unei conceptualiz ări (Gruber, 1993, Gruber, 2003) Cu alte cuvinte o ontologie reprezintă o descriere a conceptelor i a rela Ńiilor ce sunt stabilite între acestea pentru a servi unui agent sau unei comunităŃ i de agen Ńi Scopul ontologiei este definirea regulilor formale care s ă permită unei comunităŃ i de agen Ńi s ă interpreteze în acela i mod un segment al realităŃ ii (deci al existen Ńei) 116 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială 4 2 Taxonomii Taxonomia este un tip particular de ontologie Într-o taxonomie, concepte mai pu Ńin generale sunt definite în func Ńie de concepte mai generale, acestea – în func Ńie de altele înc ă mai generale decât ele a m d MulŃimea conceptelor este structurată în ierarhii (taxonomii) Rela Ńia taxonomic ă este una de mo tenire de proprietăŃ i i se noteaz ă ISA (de la is a din englez ă), AKO ( a kind of ), SUBSET, MEMBER etc 13 Dac ă x ISA y spunem c ă y este părinte pentru x, iar x este fiu al lui y De asemenea vom spune c ă orice părinte al lui x ca i orice p ărinte al unui p ărinte al lui x este un predecesor pentru x, i recursiv – orice p ărinte al unui predecesor al lui x este predecesor al lui x Reciproc, un fiu este un descendent , la fel ca i un fiu al unui fiu i un fiu al unui descendent Iată un exemplu de ierarhie, notată grafic ca în Figura 4 1: câine ISA mamifer pisic ă ISA mamifer mamifer ISA animal pe te ISA animal animal ISA entitate vie copac ISA entitate vie entitate vie ISA obiect fizic obiect fizic ISA entitate fizic ă Datorită tranzitivităŃ ii rela Ńiilor ISA, din aceste rela Ńii se pot deduce cel pu Ńin urm ătoarele: ntitate fizic ă câine ISA animal e câine ISA entitate vie câine ISA obiect fizic câine ISA entitate fizic ă o biect fizic pisic ă ISA animal pisic ă ISA entitate fizic ă mamifer ISA entitate vie entitate vie mamifer ISA entitate fizic ă pe te ISA entitate vie copac animal pe te ISA entitate fizic ă animal ISA obiect fizic animal ISA entitate fizic ă mamifer pe te copac ISA obiect fizic copac ISA entitate fizic ă entitate vie ISA entitate fizic ă îine pisic ă c Figura 4 1: Un exemplu de taxonomie No Ńiunea de concept din re Ńelele semantice este asimilabilă celei de clas ă din reprezentările orientate obiect Numele ata ate conceptelor sunt conven Ńii de nota Ńie i nu sunt suficiente pentru a individualiza conceptele între ele O reprezentare semantic ă satisfăcătoare trebuie s ă individualizeze conceptele prin descrieri 13 Unele sisteme fac deosebire între rela Ńiile ierarhice aplicate la nivelul conceptelor (numite acolo SUBSET) i cele dintre instan Ńe i concepte (numite ISA) (v de exemplu (Tufi, Cristea, 1985)) 117 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială specifice, proprietăŃ i caracteristice Descrierea unui concept este dată de rela Ńii de natură semantic ă ata ate acestuia În reprezentările noastre grafice, rela Ńiile semantice vor fi figurate prin s ăge Ńi simple etichetate cu numele lor, în timp de rela Ńiile de natură taxonomic ă (ISA) vor fi reprezentate prin s ăge Ńi îngro ate (ca în Figura 1) sau duble, unind conceptele (sau instan Ńele lor) de ascenden Ńii imedia Ńi Într-o astfel de ierarhie, conceptele mai particulare se spune c ă mo tenesc proprietăŃ ile celor mai generale Pentru c ă reprezentările noastre sunt, în esen Ńă, grafuri, adesea ne vom referi la conceptele sau instan Ńele ce le populeaz ă cu numele generic de noduri iar rela Ńiile dintre ele vor fi arcele care unesc nodurile No Ńiunea de concept nu poate fi identificată cu mulŃimea instan Ńelor sale pentru că un concept este format nu numai din mulŃimea instan Ńelor cunoscute (înregistrate la un moment dat) ale acestuia dar i de oricâte altele (necunoscute dar posibile) ce ar putea satisface proprietăŃ ile ata ate lui De exemplu conceptul de persoan ă fizic ă este constant indiferent de câte instan Ńe ale acestuia sunt cunoscute la un moment dat Deci un concept ar putea fi v ăzut ca reuniunea unei mulŃimi de instan Ńe fizice cu una de instan Ńe virtuale, aceasta din urm ă – de cardinal neprecizat, poten Ńial infinit MulŃimile (concrete ori virtuale) ale obiectelor asociate conceptelor nu sunt neap ărat disjuncte De exemplu conceptul de programator i cel de bărbat se intersecteaz ă i ambele sunt con Ńinute în cel de om Într-o reprezentare ca mulŃimi, situa Ńia poate fi redată ca în Figura 4 2a, în timp ce, într-o reprezentare comun ă re Ńelelor semantice, acelea i rela Ńii sunt redate ca în Figura 4 2b om programator ărbat rbat bprogramator bă m o on I a b Figura 4 2: De la mulŃimi de instan Ńe la concepte 4 3 Paternitate versus monotonie în sisteme ierarhice Într-un sistem ierarhic mo tenirea proprietăŃ ilor este caracterizată de dou ă dimensiuni: • paternitatea – cu simplă ori multiplă mo tenire Într-un sistem cu simplă mo tenire nici un nod nu poate avea mai mult decât un singur părinte, pe când într-un sistem cu mo tenire multiplă există cel pu Ńin un nod care are cel pu Ńin doi p ărin Ńi; 118 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială • monotonia – mo tenirea proprietăŃ ilor este monoton ă dac ă fiecare nod mo tene te toate proprietăŃ ile p ărin Ńilor i nici o nou ă proprietate ad ăugată pe un nivel inferior nu poate contrazice una omonim ă ei declarată în ierarhie pe un nivel superior Dimpotriv ă, într-un sistem nemonoton o proprietate, dac ă apare de mai multe ori, este culeas ă din predecesorul cel mai apropiat Astfel, în re Ńeaua din Figura 4 3, presupunând c ă rela Ńiile taxonomice sunt reprezentate prin s ăge Ńi îngro ate, proprietăŃ ile – prin arce orizontale sub Ńiri etichetate i c ă valoarea unei proprietăŃ i este dat de nodul în care ajunge arcul respectiv, vom g ăsi c ă proprietatea R1 a nodurilor C0 i C1 este C4, nu C5 i nici C9, i aceea i proprietate R1 a nodului C2 este C5, iar nu C9 La fel, proprietatea R2 a nodului C4 i C5 este C7, iar nu C9 Dac ă am cere valoarea proprietăŃ ii dată de o cale vid ă de rela Ńii a nodului x ar trebui să-l ob Ńinem pe x 1 R R2 R3 C6C8C9 C3 R2R1 C5C7 C2 R1 C4 C1 C0 Figura 4 3: O ierarhie nemonoton ă Cele dou ă coordonate, fiecare având dou ă valori posibile ne dau patru tipuri de sisteme Acestea sunt explicitate în cele ce urmează: • sistem monoton cu o singur ă mo tenire: fiecare entitate are un singur părinte i orice entitate în ierarhie mo tene te toate proprietăŃ ile p ărin Ńilor; • sistem nemonoton cu o singur ă mo tenire: fiecare entitate are un singur părinte i dac ă o proprietate este repetată în mai multe locuri în ierarhie, valoarea cea mai de jos este cea care primeaz ă; • sistem monoton cu mo tenire multiplă: o entitate poate avea mai mulŃi părin Ńi i orice entitate în ierarhie mo tene te toate proprietăŃ ile p ărin Ńilor; • sistem nemonoton cu mo tenire multiplă: o entitate poate avea mai mulŃi părin Ńi i, dac ă o proprietate este repetată în mai multe locuri în ierarhie, aceea i rela Ńie poate fi comunicată de mai mulŃi p ărin Ńi 119 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială 4 3 1 Solu Ńii în cazul mo tenirilor contradictorii Pentru c ă o reprezentare de tip nemonoton în care se acceptă mo tenirea multiplă poate genera contradic Ńii sau ambiguităŃ i pe motivul c ă aceea i proprietate poate fi mo tenită cu valori diferite din doi sau mai mulŃi p ărin Ńi distinc Ńi, una din urm ătoarele solu Ńii poate fi adoptată: • să se adopte o regulă de mo tenire ortogonală în proiectarea re Ńelei: informa Ńia este partiŃionată între nodurile p ărin Ńi astfel încât nici o proprietate s ă nu poate fi mo tenită de la mai mult decât un singur nod părinte; • să se stabileasc ă o regulă de prioritate între nodurile ascenden Ńi, astfel încât, dac ă aceea i proprietate apare din mai multe locuri, ordinea dată regula de prioritate s ă fie cea care s ă indice informa Ńia mo tenită Astfel, în ierarhia de clase a CLOS cât i a sistemului ELU (Estival, 1990), (Russel et al , 1992) este adoptată regula întâi-în-adâncime i de-la- stânga-la-dreapta În Figura 4-4 “ }, y); ; Procedura recursiv ă findPathRec() prime te doi parametri: ; - o structur ă de coad ă în care fiecare intrare este o pereche ; format ă dintr-un nod (în care s-a ajuns cu c ăutarea) i o cale ; de rela Ńii de la nodul de start pân ă la el: ; ; - nodul destina Ńie ; Structura de coad ă este necesar ă pentru o abordare a c ăut ării ; întâi-în-lărgime, ceea ce asigur ă calea de adâncime minim ă ; în termeni de rela Ńii taxonomice accesate end procedure findPathRec( queue , y) begin if (null( queue )) then return FAIL; }; } listParents }); ; calea de la nodul start pân ă la oricare din p ărin Ńii lui x este ; aceea i cu calea de la nodul start pân ă la x } return findPathRec(in( queue , newEntries ), y); ; În apelul recursiv coada apare incrementat ă cu noile intr ări end - Găsirea unei valori prin navigare pe o cale de rela Ńii Întrebarea este formulată astfel: plecând de la nod X s ă se g ăseasc ă nodul y la care se poate ajunge (prin mo tenire) în lungul c ăii de rela Ńii ISA*•R1•ISA*• •ISA*•Rk (pe scurt, ?y: x ISA*•R1•ISA*•…•ISA*•Rk y)? procedure getValueOnPath(x, listRel) begin getValueOnPathRec({ }); ; Procedura recursiv ă getValueOnPathRec() prime te o structur ă de ; coad ă în care fiecare intrare din este o pereche format ă ; dintr-un nod (în care s-a ajuns cu c ăutarea) i calea ; de rela Ńii care au mai r ămas de parcurs; ; Structura de coad ă este necesar ă pentru o abordare a c ăut ării ; întâi-în-lărgime, ceea ce asigur ă respectarea condi Ńiei ; de mo tenire a propriet ăŃ ilor end procedure getValueOnPathRec( queue ) begin if null( queue ) then return FAIL; }; } listParents }); ; calea de la nodul start pân ă la oricare din p ărin Ńii lui x este ; aceea i cu calea de la nodul start pân ă la x } 126 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială getValueOnPathRec(in( queue , newEntries )); ; În apelul recursiv coada apare incrementat ă cu noile intr ări end - Căutare combinată în re Ńeaua conceptuală i referen Ńială Acest tip de interogare urm ăre te reg ăsirea instan Ńei unui concept plecând dintr-o altă instan Ńă Pentru aceasta se urc ă întâi în re Ńeaua conceptuală din instan Ńa dată, se determin ă calea care une te p ărintele conceptual g ăsit cu conceptul destina Ńie i se coboară din nou în re Ńeaua referen Ńială pentru a se determina instan Ńa aflată în cap ătul c ăii de rela Ńii care au acela i nume cu cele g ăsite în re Ńeaua conceptuală, plecând din instan Ńa dată Astfel dac ă x este instan Ńa dată i C conceptul al c ărei instan Ńă se dore te a se afla, răspunsul este dat de urm ătorul lan Ń de trei interog ări: ?Cx: x ISA Cx (se cere p ărintele conceptual al instan Ńei x) ?R*: Cx R* C (se cere calea de rela Ńii in re Ńeaua conceptual ă care une te p ărintele lui x de conceptul destina Ńie C) ?y: x R* y (r ăspunsul la întrebare este dat de instan Ńa care se afl ă în cap ătul c ăii omonime de rela Ńii, plecând din x) Să urm ărim pe Figura 4 9 răspunsul re Ńelei la întrebarea: Care este densitatea corpului Cub2? ?CC: Cub2 ISA CC CC = cub ub2ub2ub2 ?R*: cub R* densitate R* = e-făcut-din • are-dens ?y: Cub2 e-făcut-din • are-dens y y = 0 8 4 4 3 Demoni Demonii sunt proceduri care nu se apeleaz ă ci se activeaz ă singure când anumite condiŃii pe care ei sunt preg ătiŃi s ă le sesizeze sunt îndeplinite Cu alte cuvinte, un demon este întotdeauna gata s ă-i ofere serviciile, atunci când cineva are nevoie de ele Un demon poate fi într-una din st ările: adormit , disponibil ( idle) sau activ Când e adormit, demonul nu este la curent asupra modific ărilor ce se petrec în lume Când e disponibil el supravegheaz ă schimb ările ce apar i este sensibil la ele, putând s ă decid ă dac ă lumea s-a schimbat în a a fel încât serviciile pe care poate el să le pun ă la dispoziŃie devin utile Când este activ demonul lucreaz ă, depune rezultatul în lume, modificând-o, dup ă care revine iar în starea disponibil Doar un alt proces poate s ă decid ă când un demon disponibil trebuie s ă adoarm ă i când un demon adormit trebuie trezit, pentru a deveni disponibil Ca exemplu de utilizare a demonilor în re Ńele semantice, s ă ne imagin ăm c ă în re Ńeaua pe care am proiectat-o deja ne intereseaz ă s ă tim i masa corpurilor Putem înscrie în re Ńea aceste informa Ńii în dou ă moduri: cântărind corpurile i ata ând valorile maselor în nodurile instan Ńă respective, ori construind un demon care devine activ numai când această informa Ńie lipse te i care e capabil s ă deduc ă masa prin calcul utilizând formula: m=r*V Această din urm ă variantă presupune interogarea re Ńelei pentru aflarea densităŃ ii i a volumului corpurilor În exemplul 127 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială nostru, procedura de calcul a masei, realizată ca un demon, este ata ată nodului conceptual obiect-fizic, prin intermediul fa Ńetei demon a proprietăŃ ii are-mas ă În aceea i manieră se pot ata a proceduri-demoni de calcul a volumelor diferitelor corpuri geometrice În Figura 4 9 acest lucru s-a realizat prin ata area fa Ńetelor demon proprietăŃ ilor are- vol ale nodurile cilindru i cub Pentru a în Ńelege felul în care un demon preia singur o sarcin ă spre rezolvare când e disponibil, s ă vedem mai întâi care e maniera uzuală în care are loc interogarea re Ńelei, urm ărind reprezentarea din Figura 4 9 Astfel, instan Ńei Cub1 îi este ata ată masa în mod explicit, prin rela Ńia are-mas ă indicând valoarea 2 500 g Pentru instan Ńa Cub2 nu se cunoa te masa direct, dar ea poate fi calculată din faptul că se tie c ă materialul din care e făcut este lemnul i se cunoa te volumul acestui corp (1 000 cm3) În sfârit, pentru Cilindru1 nu se cunoa te nici masa i nici volumul, dar se tie c ă e un cilindru făcut din fier, c ă raza bazei este de 3 cm, iar în ălŃimea de 10 cm Procedurile de tip demon amintite mai sus sunt: procedure ComputeMass( x) begin ; afl ă densitatea lui x: ? Cx: x ISA Cx ? R1*: Cx R1* densitate ? y1: x R1* y1 ; afl ă volumul lui x: ? R2*: Cx R2* volum ? y2: x R2* y2 ; calculeaz ă masa ca densitate * volum: return y1 * y2; end procedure ComputeVolCube( x) begin ; afl ă latura lui x: ? y: x are-latur ă y ; calculeaz ă volumul: return y * y * y; end procedure ComputeVolCylinder( x) begin ; afl ă raza bazei lui x: ? r: x are-raz ă r ; afl ă în ălŃimea lui x: ? h: x are-în ălŃime h ; calculeaz ă volumul: return 3 14 * r * r * h; end Pentru a exemplifica interven Ńia demonilor, s ă încerc ăm s ă răspundem la întrebarea: Ce mas ă are cilindrul 1?: 128 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială ?y: Cilindru1 ISA y y = cilindru ?R*, cilindru R* mas ă R* = are-mas ă ?y, Cilindru1 are-mas ă y nil demon: ComputeMass(Cilindru1) ?Cx: Cilindru1 ISA Cx Cx = cilindru ? R1*: cilindru R1* densitate e-făcut-din • are-dens ? y1: Cilindru1 e-făcut-din • are-dens y1 2 4 ? R2*: cilindru R2* volum R2* = are-vol ? y2: Cilindru1 are-vol y2 nil demon: ComputeVolCylinder(Cilindru1) ? r: Cilindru1 are-raz ă r r = 3 ? h: Cilindru1 are-în ălŃime h h = 10  282 6  678 24 129 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială computeVolCylinder computeMass mas ă computeVolCube are-vol (demon) are-mas ă (demon) are-vol are-mas ă (demon) e-făcut-are- obiect-fizic din material dens densitate 2500 volum are-vol are- dens corpgeometric fier lemn 0 8 2 4 1000 are-dens are- în ălŃime are-raz ă dimensiun e are-latur ă cilindru are-mas ă cub Re Ńea semantic ă conceptuală făcut-din Re Ńea semantic ă referen Ńială are-vol Cub1 Cub2 Cilindru1 făcut-din făcut-din 10 are- în ălŃime are-raz ă 3 Figura 4 9: Demonii reprezenta Ńi ca noduri procedurale în re Ńele semantice Având la baz ă mecanismul descris în această sec Ńiune, în anii ’80 a fost construit sistemul IURES15 (Tufis&Cristea, 1985), (Tufi et al , 1989), care era capabil s ă răspund ă la întreb ări adresate de un utilizator în limba român ă Aplica Ńiile dezvoltate cu IURES au vizat baza de date na Ńională de programe, o baz ă de date geografice etc 4 4 4 AmbiguităŃ i în reprezentarea prin re Ńele semantice Se cunoa te c ă re Ńelele semantice prezintă anumite slăbiciuni în modelarea lumilor statice de genul celor prezentate mai sus (Sowa, 1999) Astfel, dac ă, ignorând anumite detalii, o rela Ńie generală precum ”tatăl unei persoane este i ea o persoan ă” se reprezintă ca în Figura 4 10a, în care, conform conven Ńiilor de mai sus, 15 În Ńeleg U or Române te Eliminând Sintaxa ( I Understand and Reply Eliminating Syntax) 130 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială săgeata plin ă semnific ă o rela Ńie ISA iar cea sub Ńire – o rela Ńie semantic ă În aceste condiŃii s ă vedem cum putem reprezenta o afirma Ńie precum ” tatăl unei persoane o iube te pe mama acelei persoane”? persoan ă persoan ă re-mam ă aare-tat ă are-tat ă tat ă mam ă tat ă ube te i b a Figura 4 10: Reprezentări pentru a ”tatăl unei persoane este persoan ă” b ”tatăl o iube te pe mama” O reprezentare precum cea din Figura 4 10b poate fi defectuoas ă într-o interpretare în care rela Ńiile de la acest nivel sunt în Ńelese ca fiind mo tenite între conceptele ori instan Ńele aflate pe niveluri ierarhic inferioare Într-adevăr, presupunând c ă Ion este un tată iar Maria o mam ă, adic ă o situa Ńie ca cea din Figura 4 11, nu am vrea s ă tragem concluzia c ă Ion o iube te pe Maria, decât în cazul în care ei ar fi tatăl, respectiv mama, unei aceleia i persoane În (Thomason, Touretzky, 1991) se prezintă un sistem formal de reprezentare prin re Ńele semantice care evită ambiguităŃ i de genul celor puse în eviden Ńă în exemplul care urmeaz ă p ersoan ă are-mam ă are-tat ămam ătat ă iube te MIon aria Figura 4 11: Necazuri cu reprezentarea din Figura 4 10b O altă posibilitate ar fi înso Ńirea rela Ńiilor de condiŃii ce ar trebui s ă fie verificate asupra oric ărei perechi de instan Ńe care particularizeaz ă conceptele unite de rela Ńie De exemplu, în cazul acestui exemplu, condiŃia ata ată rela Ńiei iube te ar trebui s ă fie: iube te(x,y) Ü $a, ISA(a,persoan ă) Λ are-tat ă(a,x) Λ are-mam ă(a,y) 4 5 Re Ńele semantice evenimen Ńiale Inferen Ńe Când utiliz ăm limbajul pentru comunicare, realiz ăm continuu inferen Ńe Le facem fără nici un efort aparent; ele rezultă direct din înlănŃuirea logic ă a evenimentelor comunicate, din experien Ńa de via Ńă pe care am acumulat-o i din 131 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială cunoa terea sensurilor cuvintelor S ă încerc ăm s ă g ăsim o explica Ńie pentru care urm ătoarele dou ă propoziŃii citite ori auzite în secven Ńă au sens: 1 Maria a sc ăpat oul din mân ă 2 Ea a trebuit s ă cure Ńe apoi pardoseala În efortul de a în Ńelege acest text efectu ăm un dublu lan Ń de inferen Ńe: unul pleac ă dinspre prima fraz ă: Maria scap ă oul din mân ă când nu mai este sus Ńinut de mân ă oul cade în cădere oul atinge la un moment dat pardoseala la atingerea pardoselii, oul se sparge prin spargere, oul îi vars ă con Ńinutul pe pardoseală con Ńinutul lichid al oului se află pe pardoseală con Ńinutul oului pe pardoseală e perceput de Maria ca o murd ărie iar al doilea lan Ń de inferen Ńe are ca origine cea de a doua fraz ă: Ea = Maria trebuie s ă cure Ńe pardoseala Maria gânde te c ă se impune curăŃ area pardoselii Maria percepe pardoseala ca fiind murdară În felul acesta g ăsim un fapt folosit în comun de cele dou ă lan Ńuri inferen Ńiale: faptul că Maria gânde te c ă pardoseala este murdară, ceea ce explic ă textul i prin aceasta îl face coerent Alte inferen Ńe înso Ńesc de asemenea acest text: înainte de a fi sc ăpat, oul era Ńinut în mân ă de Maria; Maria nu a avut inten Ńia s ă scape oul; Maria este nec ăjită c ă a pierdut un ou i c ă a făcut un efort ca s ă fac ă iar pardoseala curată Gândim toate aceste lucruri fără a le folosi în vreun fel, cu excep Ńia cazului în care suntem obliga Ńi de apariŃia altor exprim ări ce ni le solicită pentru a fi, la rândul lor, în Ńelese De exemplu, dac ă prima fraza a exemplului dat mai sus, ar fi urmată de: 2a Ea punea ou ăle pe care tocmai le cump ărase din saco ă în frigider atunci fraza 2a, ca s ă fie în Ńeleas ă, trebuie s ă fie înso Ńită de urm ătoarele inferen Ńe: 1: Maria scap ă oul din mân ă dac ă scap din mân ă un ou, anterior trebuie s ă-l fi Ńinut în mân ă 2a: Ea = Maria transferă ou ă din saco ă în frigider Maria ia unul sau mai multe ou ă în mân ă i îl (le) depune în frigider dac ă iau în mân ă un ou înseamn ă c ă Ńin în mân ă oul un timp Din nou dou ă lan Ńuri inferen Ńiale se unesc într-un fapt comun: Maria Ńine un ou în mân ă Acest fapt contribuie la în Ńelegerea lui 2a în contextul în care 1 fusese pronun Ńat Cum putem simula aceste procese de inferen Ńă? 132 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială 4 5 1 Evenimente aflate în corela Ńie logic ă Implica Ńia logic ă (entailment , în englez ă) reprezintă o componentă inferen Ńială esen Ńială Evenimentele aflate în rela Ńie de implica Ńie logic ă sunt fie simultane, fie în secven Ńă unul fa Ńă de altul (cel ob Ńinut, inferat, este anterior celui presupus) (v Figura 4 12) axa timpului Figura 4 12: PoziŃionarea în timp a evenimentelor aflate în implica Ńie logic ă Exemple de implica Ńii logice: - dac ă scap un obiect din mân ă înseamn ă c ă anterior Ńineam acel obiect în mân ă; - dac ă sforăi înseamn ă c ă dorm; - dac ă iese fum înseamn ă c ă undeva arde ceva; - dac ă îmi cer scuze pentru un lucru înseamn ă c ă admit c ă am făcut acel lucru; - dac ă sunt a ezat înseamn ă c ă anterior m-am a ezat Rela Ńia de implica Ńie logic ă nu trebuie confundată cu rela Ńia de cauzalitate între evenimente În general evenimentele cauză preced temporal pe cele efect: (Figura 4 13) xa timpului aFigura 4 13: PoziŃionarea în timp a evenimentelor implicate în rela Ńie cauzală - dac ă plou ă rezultă c ă p ământul va fi ud; - dac ă m ă a ez înseamn ă c ă în foarte scurt timp voi fi a ezat; - dac ă vopsesc un obiect înseamn ă c ă obiectul va avea o altă culoare; - dac ă scap un obiect din mân ă atunci acel obiect cade Există o diferen Ńa dintre cauzalitatea din natură i reflectarea ei cognitiv ă Întrucât abordarea noastră este una legată de interpretarea textelor, în acest studiu nu ne intereseaz ă s ă modelăm realitatea ci doar maniera în care reflectăm realitatea în procesul lecturii Ce am dat mai sus sunt câteva reguli cauzale “de bun sim Ń” (common-sense) i ele pot neglija unele aspecte legate de fizic ă A a bun ăoară, căderea corpurilor presupune un câmp gravita Ńional de care Ńinem seama implicit în reprezentările noastre Dac ă îns ă ne-am plasa într-un mediu în care acesta ar lipsi, am avea nevoie de un timp în care reprezentările noastre mintale s ă sufere corec Ńii prin confruntare cu experien Ńele ce contrazic reprezentările Dup ă un timp vom fi înlocuit aceste reprezentări cu altele De exemplu: - dac ă scap un obiect din mân ă atunci acel obiect rămâne lâng ă mân ă Al treilea tip de rela Ńie logic ă între evenimente este aceea de plauzibilitate (plausibility): - dac ă un obiect cade este plauzibil ca un obstacol s ă opreasc ă c ăderea la un moment dat; 133 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială - dac ă un ou este lovit de un anumit obiect dur este plauzibil ca oul s ă se sparg ă; - dac ă vorbesc este plauzibil c ă cineva m ă ascultă; - dac ă cineva doarme este plauzibil ca el s ă sforăie Rela Ńia de plauzibilitate este una abductiv ă: ea reprezintă o inversare a rela Ńiei de implica Ńie logic ă Pentru a o explica, cineva a formulat urm ătoarea analogie: imagina Ńi-vă c ă sunte Ńi în cas ă i priviŃi pe fereastră ramurile unui pom aflat în grădin ă Dac ă cineva scutură pomul ve Ńi vedea ramurile lui tremurând Avem de-a face cu o implica Ńie logic ă Acum s ă presupunem c ă vedem ramurile pomului tremurând Dac ă presupunem c ă acest lucru are loc pentru c ă cineva scutură pomul spunem c ă am făcut o abduc Ńie Concluzia nu este sigură, ci doar probabilă, pentru că ramurile pomului pot s ă tremure i din cauz ă c ă le scutură vântul, de exemplu Rela Ńia de plauzibilitate este mai mult una de analogie De multe ori la aflarea unui eveniment ne trec prin minte cauze probabile ale lui Nu toate inferen Ńele de acest tip sunt la fel de probabile De exemplu, între cele de mai sus, ultima este cel mai pu Ńin probabilă Din punct de vedere al dispunerii în timp, evenimentul plauzibil inferat poate fi plasat simultan, anterior sau posterior celui presupus (Figura 4 14) axa timpului Figura 4 14: PoziŃionarea în timp a evenimentelor implicate în rela Ńie de plauzibilitate Revenind asupra exemplului de mai sus detaliem urm ătoarele inferen Ńe: Maria scap ă oul din mân ă CAUSE oul cade PLAUSIBLE oul se love te de un obiect PLAUSIBLE oul se sparge CAUSE con Ńinutul oului se vars ă PLAUSIBLE con Ńinutul oului ajunge pe obiect PLAUSIBLE Maria percepe con Ńinutul oului pe obiect PLAUSIBLE Maria gânde te con Ńinutul oului pe obiect ca o murd ărire a obiectului PLAUSIBLE Maria este afectată negativ de acest gând Alte inferen Ńe sunt de asemenea posibile, dar nu le detaliem aici 4 5 2 Un model inferen Ńial În cele ce urmeaz ă propunem un model de dezvoltare a inferen Ńelor în re Ńele semantice, model capabil s ă dea o explica Ńie în Ńelegerii textelor Ne intereseaz ă procesele semantice, deci vom ignora orice tratament sintactic aplicat textului Modelul presupune existen Ńa unei memorii de lung ă durată ce con Ńine reprezentări ale cadrelor evenimen Ńiale ale diferitelor sensuri ale verbelor Sensurile verbelor, substantivelor, adjectivelor i adverbelor sunt totodată individualizate în ierarhii conceptuale în maniera WordNet (Fellbaum, 1998) Modelul simuleaz ă con tientizarea “citirii printre rânduri”, a “subîn Ńelegerii” lan Ńului de evenimente care leag ă dou ă situa Ńii ori evenimente redate de text, utilizând o memorie de scurtă durată Această memorie este organizată ca o re Ńea semantic ă, fiind populată cu noduri evenimen Ńiale, instan Ńe ale verbelor-concepte 134 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială predefinite în memoria de lung ă durată Evenimentele rămân în această memorie atât cât e nevoie pentru “prinderea” în Ńelesului, adic ă realizarea unui lan Ń inferen Ńial capabil s ă g ăseasc ă leg ătura dintre dou ă fraze ce apar consecutiv în discurs Odată realizat acest lucru, memoria de scurtă durată este eliberată de nodurile ce au contribuit la acest proces, îns ă anumite rezultate ce sunt considerate “importante” pot fi eventual transferate în memoria de lung ă durată Un pas inferen Ńial poate s ă aib ă loc fie direct, prin parcurgerea unei rela Ńii implica Ńionale, cauzale ori plauzibile plecând dintr-un eveniment realizat, fie indirect, parcurgând mai întâi prin mo tenire unul sau mai multe niveluri ierarhice din reprezentarea static ă a unui tip de eveniment i efectuând apoi o implica Ńie logic ă, cauzală ori plauzibilă În cele ce urmeaz ă vom detalia acest proces pentru simularea “în Ńelegerii” exprim ării din exemplul prezentat mai sus Întâi câteva reguli inferen Ńiale: RC sc ăpa (regulă cauzală cu a sc ăpa): ori de câte ori o persoan ă scap ă un obiect, obiectul va c ădea (v Figura 4 15) De i, definirea rolurilor de AG (agent – cel mare face ac Ńiunea), REC (receptor – cel asupra c ăruia se răsfrânge ac Ńiunea), OB (obiectul angrenat în ac Ńiune), este pân ă la urm ă o chestiune de conven Ńie, atâta vreme cât nu există reguli specifice general aplicabile unor anumite roluri semantice, vom conveni s ă considerăm ca participând în postură de AG entităŃ ile care sunt activ implicat într-o ac Ńiune sau o situa Ńie, în postură de REC – pe cele implicate pasiv, iar în postură de OB – pe cele care intermediaz ă realizarea evenimentului Din acest punct de vedere, persoana care scap ă obiectul este un activ si deci joac ă rolul de AG, obiectul sc ăpat este un pasiv, asupra lui manifestându-se ac Ńiunea de sc ăpare, deci este un REC persoan ă X G Acause obiect REC a sc ăpa a c ădea Y EC R Figura 4 15: O regulă cauzală cu a sc ăpa RP c ădea (regulă plauzibilă cu a c ădea): dac ă un obiect cade este plauzibil ca dup ă un timp el s ă ating ă repede un obstacol – care este un obiect (v Figura 4 16) REC Y-obiect plausible X-obiect REC a c ădea a atinge AG MOD epede r Figura 4 16: O regulă plauzibilă cu a c ădea 135 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială RP lovi1 (regulă plauzibilă cu a lovi ): dac ă un obiect fragil love te un alt obiect dur este plauzibil ca obiectul fragil s ă se sparg ă (Figura 4 17) dur ATR -obiect Y fragil A TR EC R lausible X-obiect a lovi pa se sparge G A REC Figura 4 17: O regulă plauzibilă cu a lovi Urmând a ne sluji de ea mai târziu, s ă mai ad ăug ăm în acest punct o regulă plauzibilă cu a lovi , de data acesta în care agentul este un lichid RP lovi2: dac ă un lichid love te un obiect este plauzibil s ă credem c ă lichidul va fi întins pe acel obiect (Figura 4 18) ur d ATR Y-obiect ON REC plausible X-lichid AG a lovi a fi întins R C E Figura 4 18: Dac ă un lichid love te un obiect, e plauzibil s ă inferăm c ă lichidul va fi întins pe obiect RC sparge (regulă cauzală cu a se sparge): dac ă un recipient se sparge i el con Ńine un lichid, este cauzal adev ărat c ă lichidul se va rev ărsa din recipient (Figura 4 19) S ă urm ărim marcarea recipientului i a lichidului pe roluri REC în evenimentele de spargere i rev ărsare, ca fiind pasiv implicate în ele 136 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială -lichid Y EC CONTAINS R REC cause se sparge a se rev ărsa aX-container FROM Figura 4 19: O regulă cauzală cu a se sparge Vom vedea imediat c ă aceste reguli de “recunoa tere a realităŃ ii din jurul nostru” înc ă nu sunt suficiente pentru a modela procesul inferen Ńial din exemplul nostru Deocamdată s ă mai ad ăug ăm cunoa terea c ă un ou este (i) un recipient, în sensul de Ńin ător de substan Ńă16 De asemenea, putem vedea a se rev ărsa ca un fel particular de a c ădea în care receptorul ac Ńiunii este un lichid Dac ă adoptăm această plasare ierarhic ă17, atunci din v ărsarea con Ńinutului rezultă prin regula de plauzibilitate RP c ădea c ă acesta va atinge un obstacol Inferen Ńa este una indirectă i rezultă din compunerea a doi pa i: unul de mo tenire i celălalt cauzal În continuare vom detalia maniera în care aceste reguli se pot combina pentru a forma un lan Ń inferen Ńial 1 Maria a sc ăpat oul din mân ă Prima propoziŃie provoac ă apariŃia unui eveniment cu verbul a sc ăpa (Figura 4 20) ApariŃia unui eveniment cu a sc ăpa va amorsa un proces care verific ă pattern-urile inferen Ńiale (implica Ńionale, cauzale i plauzibile) ata ate acestui verb pa a sc ă RISA Maria G EC oul1 A ev1 PART-OF 1 mân ăFROM Figura 4 20: Evenimentul nou ap ărut ev1 16 În WordNet 1 6 o astfel de informa Ńie lipse te Un ou e privit numai din punctul de vedere biologic, ca celulă ce poate da via Ńă Informa Ńia morfologic ă, ce pune în eviden Ńă constitu Ńia sa de “Ńin ător” de substan Ńă vâscoas ă, este ignorată 17 Din nou WordNet 1 6 nu clasific ă a v ărsa ( leak, flow, pour ) ca fiind în rela Ńie de hiponimie cu a c ădea (to fall ) 137 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Procesul general este acela în care apariŃia unui eveniment al unui verb (concept) provoac ă apariŃia unor evenimente legate prin rela Ńii inferen Ńiale de acel verb Func Ńionarea în acest mod poate fi pus ă pe seama unei meta-reguli de forma: MRCause if isEvent( ev1, conc1) and isCauseRule( RC , conc1, conc2) and verifies( ev1, RC ) then born( ev2, conc2) Această meta-regulă ( meta – pentru c ă ea se aplic ă unei clase întregi de reguli cauzale) spune c ă dac ă apare un eveniment ev1, instan Ńă a unui concept conc1 (isEvent – este un predicat cu comportament de demon, el verificând existen Ńa unui eveniment dintr-o clas ă dată) i dac ă există o regulă cauzală RC în care conceptul conc1 apare ca iniŃiator i conceptul conc2 ca rezultat i dac ă evenimentul ev1 verific ă restric Ńiile semantice ale p ărŃii stângi a regulii RC, atunci se va crea un eveniment ev2, instan Ńă a conceptului conc2, împreun ă cu toate leg ăturile i obiectele noi implicate de instan Ńierea p ărŃii drepte a regulii RC Meta-regula MRCause poate fi aplicată la apariŃia evenimentului ev1 al verbului (concept) a sc ăpa ( isEvent(ev1, conc1) este instan Ńiat de ev1 = ev1 i, conc1 = a sc ăpa) pentru c ă există o regulă cauzală a lui a sc ăpa ( isCauseRule(RC, conc1, conc2) este verificată de RC = RC sc ăpa, conc1 = a sc ăpa, conc2= a cădea), i restric Ńiile semantice ata ate rolurilor AG i REC sunt verificate de, respectiv, Maria, care este o persoan ă, i oul1, care este un obiect (adic ă verifies(ev1 , RC sc ăpa ) se evalueaz ă la true) Activarea meta-regulii MRCause va determina apariŃia unui nou eveniment, ev2, care trebuie s ă fie unul al verbului a c ădea i în care rolul REC trebuie s ă fie satisfăcut de aceea i entitate care satisface rolul REC al evenimentului precedent cu a sc ăpa, adic ă oul1 (v Figura 4 21) c ădea a ISA REC oul1 ev2 Figura 4 21: Evenimentul nou ap ărut ev2 În mod analog pot fi puse în eviden Ńă alte dou ă meta-reguli, care descriu respectiv inferen Ńele implica Ńionale i pe cele plauzibile: MRImplies if isEvent(ev1, conc1) and isImplyRule(RI, conc1, conc2) and verifies(ev1, R) then born(ev2, conc2) MRPlausible if isEvent(ev1, conc1) and isPlausibleRule(RP, conc1, conc2) and verifies(ev1, R) then born(ev2, conc2) 138 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Mai departe, apariŃia unui eveniment al verbului a c ădea, prin efectul meta- regulii MRPlausible, atrage declan area regulii RP cădea (v Figura 4 16) Aceasta duce la crearea (cu un anumit grad de incertitudine, datorat naturii plauzibile iar nu sigure a ei) a unui eveniment al verbului a atinge (v Figura 4 22) În acest fel un obiect (necunoscut deocamdată) este creat El este notat aici cu X- obiect atinge a I SA oul1 AG REC X-obiect ev3 MOD r epede Figura 4 22: Evenimentul nou ap ărut ev3 al conceptului a atinge Pân ă acum trei evenimente noi populeaz ă spa Ńiul inferen Ńial al memoriei de scurtă durată ApariŃia lor simuleaz ă con tientizarea situa Ńiilor de sc ăpare din mân ă a oului, de c ădere a acestuia cât i a faptului c ă, în c ădere, acesta atinge un obiect Să observ ăm c ă prima propoziŃie nu pune în eviden Ńă obiectul de care se va lovi oul: la fel de bine el ar fi putut fi un scaun, colŃul mesei sau p ălăria unui trec ător aflat sub balconul pe care s-ar fi putut petrece acest episod… Cât de departe trebuie s ă mergem cu lan Ńul inferen Ńial? Cât de multe inferen Ńe facem? Oricâte, sau numai câte sunt necesare pentru în Ńelegerea textului Există o limită rezonabilă unde am putea opri acest lan Ń? Preocupa Ńi, în textul de fa Ńă, de găsirea unui model al în Ńelegerii în profunzime a textelor, vom ignora deocamdată întreb ări de acest gen, ce Ńin de “gestionarea” procesului inferen Ńial18 Preocuparea noastră, deocamdată, este de a arăta c ă un astfel de lan Ń se poate închide firesc pe un rezultat care include una dintre accep Ńiunile posibile ale textului Un mod particular de atingere este lovirea Astfel WordNet 2 119 raporteaz ă un sens al lui to hit ca troponim (sens particular) al verbului to touch (invers, to touch este considerat un hiperonim al lui to hit ): touch (make physical contact with, come in contact with; "Touch the stone for good luck"; "She never touched her husband"; "The two buildings almost touch") => strike, hit (produce by manipulating keys or strings of musical instruments, also metaphorically; "The pianist strikes 18 Un tip de control poate fi acela în care inferen Ńele se desfăoară tot timpul, în paralel cu citirea textului Fiecare fraz ă amorseaz ă noi lan Ńuri inferen Ńiale iar unele lan Ńuri aflate în desfăurare se pot închide atunci cînd se reg ăsesc evenimente introduse deja de alte lan Ńuri Aceste evenimente, ap ărute redundant, constituie semnale c ă un în Ńeles a fost construit Scoruri de “satisfac Ńie” pot fi imaginate care s ă dea o imagine a gradului de în Ńelegere a textului 19 Tezaurul lexical Wordnet, construit la Universitatea din Philadelphia, poate fi consultat i download-at la adresa http//www upenn edu/~wn 139 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială a middle C"; "strike `z' on the keyboard"; "her comments struck a sour note") O manieră generală în care dintr-un concept mai general se poate obŃine, prin particularizare, unul mai specific, este dată de urm ătoarea meta-regulă: MRHypernim if isEvent(ev1, conc1) and isHypernimDueToRoles(conc1, conc2, Roles) and verifiesRoles(ev1, Roles) then born(ev2, conc2) care spune c ă dac ă există un eveniment ev1 aparŃinând conceptului conc1 i dac ă conc1este un hiperonim cunoscut al conceptului conc2i dac ă particularizarea lui conc1 în conc2 se face prin rolurile Roles cu anumite valori ata ate i dac ă evenimentul ev1 verific ă rolurile Roles, atunci se creaz ă un eveniment ev2 al conceptului mai particular conc2 în care apar de asemenea valorile rolurilor Roles Figura 4 23 arată c ă rolul care particularizeaz ă a atinge în a lovi este MOD cu valoarea repede Ca urmare a aplic ării metaregulii de hiperonimie, apariŃia evenimentului ev3 duce de asemenea la apariŃia evenimentului ev4, al conceptului a lovi (v Figura 4 24) În acest eveniment, un obiect de care oul s-a lovit în c ădere este presupus (notat în Figura 4 24 cu X-obiect ) Înc ă nu tim ce poate fi acest obiect Identitatea lui va fi relevată mult mai târziu, în virtutea men Ńion ării podelei în fraza 2 din exemplul nostru repede MOD a atinge AG REC ISA Y-obiect AG REC X-obiect a lovi Figura 4 23: A lovi înseamn ă a atinge repede a lovi oul1 AG ISA REC X-obiect ev4 Figura 4 24: Avem acum un eveniment cu a lovi 140 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială În continuare, în virtutea regulilor RP lovi i RC sparge i a metaregulilor MR- Plausible i MR Cause cât i a cunoa terii faptului c ă un ou este un obiect fragil de tip container care con Ńine un lichid, dou ă noi eveniment sunt construite (v Figura 4 25) se sparge a se rev ărsa a SA ISA I e v5 ev6 ROM F REC REC A TR fragil oul1 Y- CONTAINS Figura 4 25: Con tientiz ăm spargerea oului (ev5) i rev ărsarea con Ńinutului s ău (ev6) Pentru a exemplifica maniera în care o regulă de bun sim Ń se poate aplica de mai multe ori, vom face presupunerea c ă dispunem de cunoa terea de semantic ă lexicală care claseaz ă verbul a se rev ărsa ca o form ă particulară de cădere, ca în Figura 4 26 REC Y-lichid a c ădea ISA REC a se rev ărsa Figura 4 26: Dac ă un lichid cade înseamn ă c ă el se revars ă În virtutea aplic ării meta-reguli MRHypernim din nou, existen Ńa evenimentului ev6 va duce la apariŃia unui eveniment al verbului a c ădea, iar aplicarea recursiv ă a regulii de bun sim Ń RP c ădea, va da na tere, în aceea i manieră ca i mai înainte, la un eveniment cu a atinge (v Figura 4 27) 141 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială a a c ădea atinge ISA Z-obiect ISA ROB EC Y-lichid ev7 ev8 MOD AG apid r Figura 4 27: Con Ńinutul oului cade i atinge (rapid) un obiect Să remarc ăm c ă X-obiect ul de care se love te oul nu este necesar s ă fie acela i cu Z-obiect ul de care se love te lichidul Mai departe îns ă, pentru c ă AG-ul evenimentului cu a atinge nu mai este un obiect ci un lichid, regula RP lovi nu poate fi aplicată înc ă o dată O altă regulă pragmatic ă trebuie s ă func Ńioneze, capabilă s ă infereze c ă dac ă un lichid love te un obiect, atunci lichidul se întinde pe obiect (v RP lovi2 i Figura 4 28) Ca urmare o situa Ńie în care con Ńinutul oului este întins pe acest obiect pe care l-a atins în c ădere va apare în memoria de scurtă durată: sta întins a SA I REC ev9 ON -obiect Y-Z Figura 4 28: Con Ńinutul oului este întins pe un obiect Exemplul poate fi continuat pân ă la atingerea unei stări în care Maria gânde te con Ńinutul oului pe obiect ca o murd ărire a obiectului i ea este afectată negativ de acest gând În mod analog, un proces va fi iniŃiat din fraza a doua a exemplului considerat Cum un proces de curăŃ are este datorat perceperii unei murd ării, iar necesitatea de a o curăŃ a, unei stări negative insuflată de ea, va exista un moment în care cele dou ă lan Ńuri inferen Ńiale se ating pe o stare comun ă Acest fapt comun, indus de o fraz ă i presupus de cealaltă, este liantul care face ca exprimarea s ă fie coerentă Când un astfel de proces se deruleaz ă într-o ma in ă, atunci suntem îndreptăŃ iŃi a spune c ă ma ina a „în Ńeles” exprimarea Cerin Ńe pentru studen Ńi: Să fie capabili s ă produc ă o reprezentare a cunoa terii dintr-un univers dat Să recunoasc ă necesitatea utiliz ării unei reŃele semantice descriptive sau a uneia evenimen Ńiale, în func Ńie de problem ă Să poată adapta ori produce un algoritm care s ă ofere posibilitatea ob Ńinerii de inferen Ńe în re Ńele semantice 142 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Probleme i proiecte de cas ă P4 1 Care dintre urm ătoarele propoziŃii vi se par importante în definirea re Ńelelor semantice (RS), care sunt adev ărate i care false: - RS descriu rela Ńii dintre obiecte reprezentate prin noduri; - nodurile în RS sunt cercuri cu nume; - cea mai importantă trăsătură a RS este mo tenirea proprietăŃ ilor; - cea mai importantă trăsătură a RS este mo tenirea multiplă; - ceea ce deosebe te RS de logica predicatelor de ordinul I (LPOI) este c ă în RS pot exprima Toate p ăsările zboară cu excep Ńia pinguinului, pe când în LPOI nu; - atât în LPOI cât i în RS pot deduce din „Orice om e muritor Socrates este om ” c ă „Socrates este muritor ” P4 2 S ă se reprezinte prin RS: - Un Boeing 747 este un avion - Avioanele si p ăsările zboară - Un vultur este o pas ăre - Avioanele au motoare iar p ăsările pene - Avioanele au pilot si p ăsările cioc - Atât avioanele cât si p ăsările folosesc principii aerodinamice P4 3 tiŃi urm ătoarele fapte despre lume: - cele mai multe fiin Ńe nu zboară; - cele mai multe p ăsări, fiin Ńe fiind, zboară; - pinguinii i stru Ńii, p ăsări fiind, nu zboară; - stru Ńii magici îns ă zboară; - Birco este o pas ăre; - Zuicu este fie un pinguin, fie un stru Ń; - Cro Ń este un stru Ń magic a) Da Ńi o reprezentare a acestor cuno tin Ńe prin re Ńele semantice descriptive b) Aplicând reguli de mo tenire nemonoton ă, răspunde Ńi apoi la întreb ările: - Birco zboară? - dar Zuicu? - dar Cro Ń? - dar Mo Ńu? P4 4 tiŃi urm ătoarele fapte despre lume i numai pe acestea: - bicicletele cântă, sunt prev ăzute cu spiŃe i împletesc ciorapi; - caii, biciclete fiind, v ăd dar nu împletesc ciorapi pentru c ă sunt prev ăzu Ńi cu ei; - ochelarii, biciclete fiind, v ăd dar nu cântă pentru c ă nu sunt prev ăzute cu spiŃe; - ochelarii de soare îns ă nu v ăd; - i oricine tie c ă lucrurile nu v ăd i nu pot cânta; - bicicletele, ca orice din lumea asta, sunt lucruri Să se enun Ńe proprietăŃ ile calului lui Nero, ale bicicletei ro ii din holul FacultăŃ ii, ale ochelarilor de soare ai domnului decan i ale Dun ării albastre P4 5 Să se reprezinte cu ajutorul re Ńelelor semantice cunoa terea din urm ătorul text: Aorta este un tip particular de arteră care are un diametru de 2 5 cm O arteră este un vas de sânge, cu perete muscular i diametrul de 0 4 cm O ven ă e un vas de sânge cu pere Ńi fibro i Vasele de sânge au form ă tubulară i con Ńin sânge P4 6 Informa Ńii asupra arborelui genealogic al unei familiei sunt descrise ca o re Ńea semantic ă în care nodurile sunt persoane i leg ăturile sunt c ătre p ărin Ńi i (eventual) c ătre fii Pentru orice persoan ă se cunoa te sexul Desena Ńi re Ńeaua pentru arborele genealogic: 143 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Lili si Axinte sunt copiii lui Leana si Costel Florin si Ion sunt fiii lui Lili si Vasile Ioana e fata lui Maria si Axinte, iar Cornel e fratele s ău Pe unchiul lui Cornel îl cheam ă Gigel a) Descrie Ńi un mod de reprezentare a re Ńelei semantice prin liste LISP b) Scrie Ńi func Ńii LISP care s ă permită aflarea bunicilor i a verilor unei persoane P4 7 Să se completeze re Ńeaua semantic ă relativ ă la corpuri geometrice dată la curs cu o piramid ă PIRAM1 făcută din aluminiu (greutate specific ă 2 7 g/cm3) i de volum 50 cm3 S ă se arate care sunt interog ările lansate asupra re Ńelei de un apel al demonului computeMass(PIRAM1) P4 8 Să se reprezinte cuno tin Ńele din fraza urm ătoare folosind re Ńele semantice evenimen Ńiale: Maria crede c ă lui Ion nu îi place s ă înoate, de aceea nu merge în vacan Ńă la mare P4 9 CitiŃi urm ătorul text: Maria a v ăzut un om intrând în casa ei Ea a chemat PoliŃia a Da Ńi o reprezentare prin re Ńele semantice evenimen Ńiale a acestor dou ă fraze b Preciza Ńi un set de reguli inferen Ńiale care, aplicate în secven Ńă, s ă dea sens acestui text P4 10 Analiza Ńi-vă reac Ńiile vis-à-vis de cele dou ă secven Ńe de mai jos Explica Ńi motivele acestor reac Ńii ConstruiŃi un sistem capabil s ă reac Ńioneze la fel ca dv A Mihai s-a dus la sta Ńie s ă fac ă plinul dar benzinarul i-a spus c ă nu mai are benzin ă B Mihai s-a dus la sta Ńie s ă fac ă plinul dar benzinarul i-a spus c ă nu mai are benzin ă în ma in ă Bibliografie Barr, A and Feigenbaum, E A 1981 Handbook of Artificial Intelligence, (Eds ), William Kaufman, Inc , Los Altos, California, 409 pp, ISBN 0-86576-005-5, vol 1 Cristea, D 2002 Să ne juc ăm cu cuvintele Proiecte de prelucrare a limbajului natural - 1, Revista de Informatic ă, nr 1, Ia i Fellbaum, C (ed ) 1998 WordNet An Electronic Lexical Database, The MIT Press Gruber, T R 1993 Toward principles for the design of ontologies used for knowledge sharing În „Formal Ontology in Conceptual Analysis and Knowledge Representation”, edited by Nicola Guarino and Roberto Poli, Kluwer Academic Publishers, Accesibilă la adresa: http://www cise ufl edu/~jhammer/classes/6930/XML-FA02/papers/gruber93ontology pdf Gruber, T R 2003 What is an Ontology V http://www-ksl stanford edu/kst/what-is-an-ontology html Sowa, J F , 1999 Knowledge Representation: Logical, Philosophical, and Computational Foundations, Brooks Cole Publishing Co 144 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Thomason, R H , Touretzky, D S 1991 Inheritance Theory and Networks with Roles, în John Sowa (ed ): „Principles of Semantic Networks Explorations in the Representation of Knowledge”, Morgan Kaufmann Publishers, Inc , San Mateo Tufi,D ; Cristea,D 1985 IURES:A Human Engineering Approach To Natural Language Question- Answering Systems În Bibel,W ; Petkoff,B (Eds ) „Artificial Intelligence Methodology, Systems, Applications” North-Holland, Amsterdam, pag 177-184 Tufi, D , Giumale, C , Cristea, D 1989 Lisp Ed Tehnic ă, Bucure ti, vol 2 145 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Capitolul 5 Probleme de satisfacere a constrângerilor Atunci când nu faci gre eli, nu rezolvi probleme îndeajuns de complexe i asta e o mare gre eală Frank Wilczek 5 1 Introducere Faptul c ă satisfacerea constrângerilor s-a configurat actualmente ca un domeniu important i de sine stătător în informatica teoretic ă i aplicată este datorat multitudinii de situa Ńii din lumea reală care pun pe tapet probleme ce impun respectarea simultan ă a mai multor cerin Ńe O listă a domeniilor care abund ă în astfel de probleme trebuie s ă includ ă: planificarea automată, configurarea resurselor, design, diagnosticare, ra Ńionare temporală i spa Ńială etc Satisfacerea constrângerilor este acel subdomeniu al inteligen Ńei artificiale care încearc ă determinarea unei solu Ńii practice cât mai bune dată fiind o listă de constrângeri i priorităŃ i Formal, o problem ă de satisfacere a constrângerilor (eng : constraint satisfaction problem – CSP) este definită printr-o re Ńea de constrângeri O re Ńea de constrângeri constă dintr-o mulŃime de variabile X={ X1,…, Xn} i o mulŃime de constrângeri C={C1, , Ct} Fiecare variabilă Xi poate lua valori dintr-un domeniu Di O constrângere Ci este o rela Ńie Ri definită pe o submulŃime de variabile i care determin ă asign ări legale de valori Re Ńeaua este referită printr-un triplet R=( X, D, C) O solu Ńie pentru o astfel de problem ă este o asignare de valori variabilelor astfel încât toate constrângerile s ă fie satisfăcute (Dechter, 2003; Tsang, 1993) Ca o observa Ńie, în definiŃie nu se impune nici o condiŃie asupra tipului variabilelor Acestea pot fi întregi, logice, mulŃimi, sau de orice alt tip De asemenea, nici modul de definire a constrângerilor nu este limitat Constrângerile pot fi date atât explicit, prin specificarea tuplelor de valori permise, cât i implicit, prin rela Ńii (ex: Xi > 2) O problem ă pentru care există o solu Ńie se nume te satisfiabilă sau consistentă În caz contrar, ea se nume te nesatisfiabilă sau inconsistentă Există situa Ńii în care se dore te determinarea tuturor solu Ńiilor, sau doar a uneia sau, în caz de inconsisten Ńă, specificarea acestui lucru În practic ă, deseori este greu de determinat o asignare care s ă satisfac ă toate constrângerile O extensie a problemei CSP este problema Max-CSP în care scopul este g ăsirea unei asign ări cu num ăr minim de constrângeri violate În cazul în care constrângerile implic ă cel mult dou ă variabile, numim problema CSP-binară O problem ă de satisfacere a constrângerilor poate fi reprezentată printr-un graf, numit graf constrâns Pentru fiecare variabilă este asociat un nod, iar un arc este trasat între fiecare pereche de variabile con Ńinute într-o constrângere 146 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Exemplul 5 1: problema reginelor Dată fiind o tablă de ah n x n dorim s ă plas ăm n regine pe tablă astfel încât nici o regin ă s ă nu fie atacată de nici o altă regin ă O posibilă formulare a problemei reginelor ca o problem ă CSP ar fi urm ătoarea: pentru fiecare coloan ă a tablei de ah asociem o variabilă Xi, iar domeniul variabilei sunt liniile, adic ă Di = {1, , n} Constrângerile sunt asociate fiec ărei perechi de coloane i precizeaz ă urm ătorul fapt: dou ă regine nu se pot afla pe aceea i linie sau pe aceea i diagonală, ceea ce se exprim ă prin rela Ńiile: Xi ≠ Xj |Xi – Xj| ≠ | i-j|, pentru oricare i, j din intervalul 1, , n Particularizând la n = 4, se ob Ńine problema celor 4-regine, în care variabilele sunt {X1, X2, X3, X4}, fiecare având domeniul {1, 2, 3, 4} Constrângerile sunt C1 = R12, C2 = R13, C3 = R14, C4 = R23, C5 = R24, i C6 = R34, date, în form ă extensională, ca în Figura 5 1 X1 X2 X3 X4 1 Q R12 = {(1,3), (1,4), (2,4), (3,1), (4,1), (4,2)} R = {(1,2), (1,4), (2,1), (2,3), (3,2), (3,4), (4,1), (4,3)} 13 2 Q R = {(1,2), (1,3), (2,1), (2,3), (2,4), (3,1), (3,2), (3,4), 14 (4,2), (4,3)} 3 Q R = {(1,3), (1,4), (2,4), (3,1), (4,1), (4,2)} 23 4 Q R24 = {(1,2), (1,4), (2,1), (2,3), (3,2), (3,4), (4,1), (4,3)} R34 = {(1,3), (1,4), (2,4), (3,1), (4,1), (4,2)} Figura 5 1: Problema celor 4-regine ca o problem ă de satisfacere a constrângerilor Graful constrâns este complet deoarece poziŃia unei regine pe o coloan ă influen Ńeaz ă poziŃiile valide ale reginelor pe restul coloanelor Exemplul 5 2: Problema colorării h ărŃii Dată o hartă cu n Ńări, s ă se asigneze câte o culoare dintr-o mulŃime dată fiec ărei Ńări, astfel încât Ńările vecine s ă aib ă culori diferite Asign ăm fiecarei Ńări de pe hartă o variabilă care va avea ca domeniu mulŃimea de culori Între dou ă Ńări vecine în graful constrâns vom ad ăuga un arc 147 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială a) b) Figura 5 2: a) Problema colorării unei h ărŃi cu 5 Ńări, culorile posibile fiind ro u, albastru i verde b) Graful constrâns Exemplul 5 3: Sudoku Cele mai răspândite puzzle-uri Sudoku sunt cele de ordin 3 Un astfel de puzzle constă dintr-o tablă de 9 x 9, în care fiecare p ătrat poate avea un num ăr de la 1 la 9 Dată o asignare parŃială a tablei, scopul este de a completa poziŃiile rămase libere astfel încât fiecare num ăr s ă apară o singură dată pe o linie, pe o coloan ă i într-o regiune 3 x 3 O posibilă modelare ca o problem ă CSP: fiecare poziŃie a tablei este reprezentată de o variabilă, iar domeniul unei variabile este un num ăr de la 1 la 9 Pentru fiecare linie, coloan ă i bloc 3 x 3 vom asocia o constrângere de tip alldifferent, care specific ă c ă toate variabilele din constrângere trebuie s ă aib ă valori diferite de restul variabilelor 2 8 9 7 1 4 7 2 5 9 2 8 6 3 5 6 9 7 6 1 3 1 8 6 2 2 6 4 5 Figura 5 3: O tablă Sudoku Când există preferin Ńe între solu Ńii, acestea pot fi exprimate cu ajutorul unei func Ńii de cost, numită i func Ńie obiectiv Scopul problemei este de a determina o solu Ńie cu costul cel mai bun sau o aproximare a acesteia Astfel de probleme se numesc probleme de optimizare a constrângerilor ( constraint optimization) În general problemele de satisfacere a constrângerilor sunt din punct de vedere computa Ńional intractabile ( NP-hard) Tehnicile utilizate în rezolvarea unor astfel de probleme se împart în dou ă mari categorii: c ăutare i inferen Ńă Algoritmii de c ăutare traverseaz ă spa Ńiul solu Ńiilor parŃiale construind o instan Ńiere completă care satisface toate constrângerile, sau determin ă inconsisten Ńa problemei Din cadrul acestor tehnici fac parte schemele de backtracking Algoritmii de inferen Ńă a 148 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială consisten Ńei modific ă la fiecare pas problema pentru a o face mai explicită, prin urmare mai u or de rezolvat Există algoritmi care combin ă cele dou ă metode i care dau rezultate mai precise 5 2 Backtracking în satisfacerea constrângerilor Putem aplica un algoritm de backtracking pentru parcurgerea în adâncime (DFS) a arborelui de c ăutare Ordinea variabilelor poate fi fixată înainte sau poate fi determinată la execu Ńie Algoritmul men Ńine de-a lungul execu Ńiei o mulŃime de variabile instan Ńiate corect, adic ă o solu Ńie parŃială pe care o extinde pas cu pas IniŃial, mulŃimea este vid ă La fiecare pas se selecteaz ă urm ătoarea variabilă din ordonare i se încearc ă asignarea variabilei cu o valoare consistentă cu instan Ńierea parŃială Dac ă este g ăsită o astfel de valoare, algoritmul continu ă procedeul cu urm ătoarea variabilă În caz contrar, algoritmul se întoarce la variabila anterioară i ii asigneaz ă o altă valoare consistentă Dac ă domeniul unei variabile devine vid, atunci nu există o solu Ńie care s ă satisfac ă toate constrângerile Algoritmul este descris mai jos Intrarea algoritmului este re Ńeaua de constrângeri R=(X, D, C) MulŃimile Di' p ăstreaz ă valori din domeniul Di care nu au fost înc ă examinate pentru instan Ńierea parŃială curentă În cazul în care domeniile sunt mulŃimi ordonate de întregi nu mai sunt necesare aceste mulŃimi, ci doar un indicator care s ă specifice poziŃia pân ă la care au fost considerate valorile procedure BACKTRACKING( R) begin i ← 1; Di' ← Di; while 1 ≤i≤n { Xi ← SELECTEAZ Ă-VALOARE(); if Xi = null then i ← i-1; (întoarcere) else { i ← i+1; (înaintare) Di' ← Di; } } if i = 0 then return “problem ă inconsistent ă”; else return instan Ńierile variabilelor Xi; end procedure SELECTEAZ Ă-VALOARE() begin while Di' nu e vid { selecteaz ă aleator o valoare a din Di'; Di' ← Di' \{a}; if asignarea ( Xi = a) este consistent ă cu ( a1,…, ai) then return a; } return null; end Algoritmul are complexitatea timp exponen Ńială i complexitatea spa Ńiu liniară 149 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Ac Ńiunile algoritmului de c ăutare pot fi descrise de un arbore de c ăutare În Figura 5 4 este schiŃat subarborele asociat problemei de colorare a h ărŃii din exemplul 5 2 pentru o asignare parŃială R X1 V A RX2 R V A X3 R V A X4 R V A X5 Figura 5 4: Subarborele de c ăutare pentru cazul în care nodul X1 este colorat cu ro u (R), X2 cu verde (V) i X3 cu albastru (A); nodurile întunecate nu reprezintă asign ări valide Îmbun ătătirile cunoscute ale algoritmului s-au focalizat pe cele dou ă faze ale algoritmului: pasul de înaintare (schemele look-ahead) i pasul de întoarcere (schemele look-back) Dintre aceste extensii amintim: - backmarking: reduce num ărul de verific ări ale consisten Ńei; - backjumping: îmbun ătăŃ ete alegerea variabilei pentru pasul de întoarcere; - forward-checking: verific ă ca valoarea selectată pentru noua variabilă s ă fie compatibilă cu valorile variabilelor viitoare O altă direc Ńie de îmbun ătăŃ ire o constituie euristicile de ordonare a variabilelor, statice i dinamice pentru selectarea variabilei urm ătoare Există i câteva abord ări care ”înva Ńă” prin înregistrarea de constrângeri adiŃionale de-a lungul c ăutării Exemplific ăm în continuare câteva din aceste tehnici 5 2 1 Backjumping Unul din dezavantajele algoritmului backtracking este a a zisul mecanism de trashing: aceea i situa Ńie de blocaj ( dead-end) poate fi întâlnită de mai ori O situa Ńie de blocaj apare atunci când nu există o valoare consistentă din domeniul noii variabile cu asignarea parŃială anterioară Dac ă Xi este variabila la care apare blocajul, algoritmul de backtracking se va întoarce la variabila anterioară Xi-1 Să presupunem c ă nu există nici o constrângere între variabilele Xi i Xi-1 i c ă există o nou ă valoare pentru Xi-1 Acela i blocaj va fi întâlnit pân ă când vor fi epuizate toate valorile lui Xi-1 Pentru a reduce astfel de verific ări inutile, a fost propus ă o nou ă schem ă de backtracking numită backjumping (Gaschnig, 1979; Dechter, 1990) Acest algoritm se întoarce la variabila care cauzeaz ă blocajul Identificarea unei astfel de variabile se bazeaz ă pe no Ńiunea de mulŃime conflict O instan Ńiere consistentă ( a1,…, ai) este o mulŃime conflict pentru variabila neinstan Ńiată X (sau ( a1, …, ai) este în conflict cu X) dac ă nici o valoare din domeniul lui X nu este consistentă cu asignarea ( a1,…, ai) Când se ajunge într-o situa Ńie de blocaj, este recomandat s ă ne întoarcem cât mai 150 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială mult posibil, fără îns ă a omite posibile solu Ńii O variabilă este responsabilă pentru situa Ńia de blocaj ( culprit variable) dac ă instan Ńierea ( a1,…, ab) este o mulŃime conflict minimală, adic ă indicele b este cel mai mic indice cu proprietatea b ≤ i, pentru care ab este în conflict cu Xi+1 Variabila cauz ă este sigură i optimală; sigură în sensul c ă nu poate fi extins ă la o solu Ńie i optimală deoarece întorcându-ne la un nod dinaintea acesteia risc ăm s ă pierdem solu Ńii Algoritmul backjumping al lui Gaschnig este una din metodele care implementeaz ă această idee Pentru a localiza o astfel de variabilă, algoritmul utilizeaz ă urm ătoarea tehnic ă de marcare: pentru fiecare variabilă Xi este re Ńinut un pointer ultimi la cea mai recentă variabilă pentru care s-a testat consisten Ńa cu Xi i care are o valoare în conflict cu o valoare din domeniul lui Xi Pe m ăsură ce este completată asignarea parŃială, se înregistreaz ă o serie de informa Ńii care vor fi utilizate pentru a determina variabila ce cauzeaz ă blocajul Dac ă pentru asignarea (a1,…, ai) există o valoare consistentă atunci ultimi v-a fi egal cu i-1 Când ajungem într-o situa Ńie de blocaj i asignarea ( a1,…, ai) este inconsistentă cu Xi+1, algoritmul se va întoarce la variabila cauz ă, Xultim(i+1) procedure BACKJUMPING( R) begin i ← 1; Di' ← Di; ultimi ← 0; while 1 ≤i≤n { Xi ← SELECTEAZ Ă-VALOARE(); if Xi = null then i ← ultimi; ( întoarcere) else { i ← i+1; Di' ← Di; ultimi ← 0; } } if i = 0 then return “problem ă inconsistent ă”; else return instan Ńierile variabilelor Xi; end procedure SELECTEAZ Ă-VALOARE() begin while Di' nu e vid { selecteaz ă aleator o valoare a din Di'; Di' ← Di' \{a}; consistent ← true; k ← 1; while k ultimi then ultimi ← k; if asignarea par Ńial ă ( a1,…, ak,Xi=a) nu este consistent ă then consistent ← false; else k ← k + 1; } 151 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială if consistent = true then return a; } return null; end Ca i la backtracking, parametrul de intrare R este re Ńeaua de constrângeri Exemplul 5 4: considerăm problema de 3-colorare al c ărei graf este dat în figura de mai jos MulŃimea de culori este: ro u, verde i albastru RX1 R A V X2 R A V X3 A V nu mai e verificat de R X4 backjumping R A V R A V a) X5 b) Figura 5 5: a) graful b) subarborele de c ăutare Mai sus avem subarborele de c ăutare pentru cazul în care nodul X1 este colorat cu ro u (R), X2 este colorat cu albastru (A) i X3 cu verde (V) În cazul în care nodul X4 este colorat cu ro u, pentru nodul X5 nu mai există nici o valoare consistentă cu asignarea parŃială; suntem deci într-o situa Ńie de blocaj Dac ă am fi aplicat algoritmul backtracking, ne-am fi întors la variabila X4 i am fi încercat a-i asigna o nou ă valoare (albastru), ajungând îns ă în aceea i situa Ńie de blocaj Între X4 i X5 nu există nici o constrângere Algoritmul backjumping se întoarce la variabila care este cauz ă a blocajului, în cazul nostru variabila X3 Astfel reducem num ărul de verific ări inutile deoarece nu vom mai testa o porŃiune a acestui subgraf O altă variantă de backjumping este algoritmul graph-based backjumping care extrage informa Ńii despre posibile mulŃimi de conflicte din graful constrâns Când apare o situa Ńie de blocaj algoritmul se întoarce la cea mai recentă variabilă care este conectată cu variabila curentă în graful constrâns 5 2 2 Forward-checking În algoritmul backtracking dup ă selectarea variabilei urm ătoare, valoarea acesteia va fi aleas ă astfel încât s ă fie consistentă cu instan Ńierea parŃială Forward- checking (Haralick, 1980) verific ă ca această valoare s ă fie compatibilă cu cel pu Ńin o valoare din domeniul fiec ărei variabile viitoare Astfel algoritmul instan Ńiaz ă variabila cu o valoare i apoi elimin ă valori din domeniul varibilelor viitoare care sunt în conflict cu instan Ńierea curentă Dac ă domeniul unei variabile viitoare devine vid, algoritmul consideră urm ătoarea valoare posibilă pentru variabila curentă Algoritmul este descris mai jos Fie Xi variabila curentă Ca i la backjumping, mulŃimile D' con Ńin domeniile reduse IniŃial acestea sunt egale cu domeniile 152 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială originale, i vor fi modificate în func Ńia SELECTEAZ Ă-VALOARE FORWARD- CHECKING() (referit ca FC, mai departe) alege variabilei curente o valoare consistentă cu variabilele viitoare procedure FORWARD-CHECKING( R) begin Di' ← Di , 1 ≤i≤n; i ← 1; while 1 ≤i≤n { selecteaz ă pentru Xi o valoare din domeniu consistent ă cu cel pu Ńin o valoare pentru fiecare din variabilele urm ătoare: Xi ← SELECTEAZ Ă-VALOARE(); if Xi = null then { i ← i-1 reseteaz ă Dk' la valoarea dinaintea ultimei instan Ńieri a lui Xi, k>i; } else i ← i+1; } if i = 0 then return “problem ă inconsistent ă” else return instan Ńierile variabilelor Xi; end procedure SELECTEAZ Ă-VALOARE() begin while Di' nu e vid { selecteaz ă aleator o valoare a din Di' ; Di' ← Di' \{a}; domeniu-vid ← false; for 1 ≤k≤n { for b din Dk' if asignarea ( a1,…, ai,Xi=a,Xk=b) nu este consistent ă -1 then Dk' ← Dk' \{b}; if Dk' este vid (bolcaj) then domeniu-vid ← true; } if domeniu-vid = true then reseteaz ă Dk' la valoarea dinaintea select ării lui a, i≤k≤n; else return a; } return null; end Reluarea exemplului 5 1: considerăm problema celor 4 regine, modelată ca în Exemplul 5 1, în cazul în care am asignat variabilei X1 valoarea 4 La acest pas, algoritmul FC elimin ă temporar din domeniul variabilei X2 valorile 3 i 4 deoarece nu 153 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială sunt consistente cu asignarea parŃială ( X1=4) (a) Similar pentru domeniile variabilelor X3 i X4 Cazul în care pentru variabila X2 este aleas ă valoarea 1 este eviden Ńiat la punctul b) – noi valori pentru varialibele X3 i X4 sunt restric Ńionate Singura valoare rămas ă pentru variabila X3 este 3 Alegând această valoare, domeniul variabilei X4 devine vid (blocaj) a) X2 X3 X4 X1X1=4 1 X D = {1,2}, D = {1,3}, D = {2,3} 34 2 2 X 3 X Q X X X 4 b) XX2X3X4 1 Q X X X1=4, X2=1 XD3 = {3}, D4 = {2} X X Q X X X c) X1 X2 X3 X4 Q X X =4, X2=1, X3=3 X X X1 = {} D4 X Q X Q X X X Figura 5 6: execu Ńia pas-cu-pas a algoritmului FC pentru problema celor 4-regine; a) dup ă asignarea variabilei X1 b) dup ă asignarea lui X2 c) dup ă asignarea lui X3 5 3 Inferen Ńa Algoritmii de inferen Ńă transform ă problema într-una echivalentă, mai explicită prin deducerea unor noi constrângeri care vor fi adăugate mulŃimii iniŃiale Spre exemplu, din constrângerile X=Y i Y=Z putem deduce o nou ă constrângere X=Z Cele dou ă probleme sunt echivalente, adic ă au acela i set de solu Ńii, îns ă utilizând cea de-a doua reprezentare putem evita situa Ńii de blocare pe care le-am fi întâlnit în primul caz Cum problema devine mai restrictiv ă, spa Ńiul de c ăutare se va mic ora, în consecin Ńă c ăutarea va fi mai eficientă 154 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Un algoritm de propagare a constrângerilor garanteaz ă c ă orice solu Ńie parŃială poate fi extins ă la o nou ă variabilă astfel încât noua asignare s ă rămân ă consistentă (Mackworth, 1977) Algoritmii de i-consisten Ńă în general garanteaz ă c ă orice instan Ńiere consistentă a i-1 variabile poate fi extins ă la o instan Ńiere consistentă de lungime i Cel mai cunoscut algoritm de consisten Ńă este arc- consisten Ńa (sau 2-consisten Ńa) 5 3 1 Arc-consisten Ńă O componentă principală a algoritmului de arc-consisten Ńă o constituie procedura pentru verificarea consisten Ńei valorilor din domeniu în raport cu o constrângere Procedura Revise() are ca intrare dou ă variabile Xi i Xj (indicii lor) i verific ă dac ă pentru fiecare valoare y din Di există cel pu Ńin o valoare compatibilă cu ea din domeniul Dj Dac ă nu există o astfel de valoare, atunci o atribuire de tipul Xi=y nu este valid ă Rezultă c ă valoarea y poate fi tearsă din domeniu procedure REVISE( i,j) begin for y în Di if nu exist ă o valoare z în Dj a î asignarea ( Xi=y,Xj=z) să fie consistent ă: ijRzyÎ),( then terge y din Di; end Complexitatea procedurii este O( k2), unde k este dimensiunea domeniului Descriem în continuare cea mai simplă variantă de arc-consisten Ńă Algoritmul Arc-Consisten Ńă-1 ( AC-1) aplic ă procedura Revise tuturor perechilor de variabile care particip ă într-o constrângere pân ă când nu se mai modific ă nici un domeniu procedure AC-1( R) begin repeat for perechea { Xi,Xj} care particip ă într-o constrângere { Revise( i,j); Revise( j,i); } until nici un domeniu nu se mai modific ă end Complexitatea algoritmului AC-1 este O( enk3), unde n este num ărul de variabile, domeniul este limitat superior de k, iar e num ărul de constrângeri binare Exemplul 5 5 Considerăm urm ătoarea problem ă de colorare a grafului cu nodurile X1, X2, X3 Domeniile de valori ale variabilelor asociate vârfurilor grafului sunt D1={R,V,G}, D2={R,V}, D3={V} Graful constrâns este reprezentat mai jos 155 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială a) b) Figura 5 7: Problema colorării grafului: noduri X1, X2, X3; domeniile sunt cele din interiorul elipselor a) graful constrâns in Ńial b) graful dup ă aplicarea arc-consisten Ńei La examinarea arcului dintre nodurile X1 i X2 nu se modific ă domeniul nici unei variabile În cazul arcului ( X1,X3) pentru culoarea verde (V) a nodului X1 nu există o culoare corespondentă diferită de aceasta pentru a satisface constrângerea Astfel valoarea verde va fi eliminată din domeniul variabilei X1 Procedeul continu ă similar prin eliminarea valorii verde pentru variabila X2 la procesarea nodului (X2,X3), rezultând graful din Figura 5 7 b) Una din îmbun ătăŃ irile algoritmului AC-1 se sprijin ă pe urm ătoarea observa Ńie: chiar dac ă numai un singur arc este modificat la itera Ńia curentă, AC-1 revizuie te toate arcele la itera Ńia urm ătoare; este mult mai probabil ca un num ăr mic de arce s ă fie afectate de această modificare Algoritmul AC-3 elimin ă acest dezavantaj revizuind doar acele constrângeri care pot fi afectate de modific ările de la itera Ńia anterioară Re Ńinem într-o coad ă constrângerile care trebuiesc procesate IniŃial fiecare pereche de variabile care particip ă într-o constrângere este pus ă în coad ă de dou ă ori (pentru fiecare ordonare a perechii de variabile) La procesarea unei perechi ordonate de variabile, aceasta va fi tears ă din coad ă i va fi ad ăugată din nou în coad ă doar dac ă domeniul celei de-a doua variabile este modificat în urma proces ării constrângerilor adiacente procedure AC-3(R) begin Q ← Ø for perechea { X,X} care particip ă într-o constrângere ij { Q insereaz ă(X,X); ij Q insereaz ă(X,X); ji } while Q nu e vid ă { Q terge( X,X); ij Revise( i,j); if Revise( i,j) modific ă D then i Q insereaz ă(X,X), unde i≠k, dac ă arcul nu exist ă în Q; ki } end Exemplul 5 6: considerăm problema din Exemplul anterior 5 5 La procesarea constrângerii dintre variabilele X1 i X2 domeniile variabilelor rămân neschimbate 156 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Când verific ăm arcul ( X1,X3) domeniul variabilei X1 se modific ă Ad ăug ăm la coad ă arcul ( X2,X1) (arcul ( X3,X1) există deja în coad ă) Procedeul este repetat până când coada devine vid ă Observ ăm c ă dac ă am fi utilizat AC-1 am fi verificat în plus înc ă 4 arce corespunz ătoare constrângerilor dintre X1 i X3, respectiv X2 i X3 Tabela 5 1:execu Ńia algoritmului AC-3 pentru problema de colorare din Exemplul 5 5 arc Q domenii {(X1,X2), (X2,X1), (X1,X3), (X3,X1), (X2,X3), D1={R,V,G}, D2={R,V}, D3={V} (X3,X2)} (X1,X2) {(X2,X1), (X1,X3), (X3,X1), (X2,X3), (X3,X2)} (X2,X1) {(X1,X3), (X3,X1), (X2,X3), (X3,X2)} (X1,X3) {(X3,X1), (X2,X3), (X3,X2), (X2,X1)} D1={R,G}, D2={R,V}, D3={V} (X3,X1) {(X2,X3), (X3,X2), (X2,X1)} (X2,X3) {(X3,X2), (X2,X1), (X1,X2)} D1={R,G}, D2={V}, D3={V} (X3,X2) {(X2,X1), (X1,X2)} (X2,X1) {(X1,X2)} (X1,X2) {} Complexitatea algoritmului AC-3 este O( ek3) Algoritmul de arc-consisten Ńă poate fi îmbun ătăŃ it mai mult, ajungându-se la complexitatea minim ă de O( ek2) Algoritmii care asigură consisten Ńă locală sunt folosiŃi în general ca algoritmi de preprocesare, utiliza Ńi înaintea c ăutării Backtracking-ul va fi mai eficient pe reprezentări mai explicite, deci cu un grad de consisten Ńă locală mai mare Metodele folosite în practic ă combin ă de obicei inferen Ńa cu c ăutarea, în ideea îmbun ătăŃ irii rezultatelor c ăutării Trebuie avută îns ă grijă la cantitatea de inferen Ńă utilizată: este bine de obicei s ă existe un echilibru între efortul depus în propagarea constrângerilor i cel depus în c ăutare 5 3 2 Bucket-Elimination Deoarece algoritmii de c ăutare în mod uzual extind o solu Ńie parŃială pas cu pas, inferen Ńa poate fi restric Ńionată la o ordine a variabilelor Această idee corespunde no Ńiunii de consisten Ńă direc Ńională Bucket-elimination (Dechter, 1996) este un algoritm din această categorie, mai pu Ńin costisitor Algoritmul are ca intrare o mulŃime de rela Ńii sau constrângeri Dată o anumită ordonare, algoritmul împarte mulŃimea de rela Ńii în submulŃimi ( bucket-uri) Fiecare submulŃime este asociată unei singure variabile O rela Ńie va aparŃine submulŃimii corespunz ătoare argumentului care apare ultimul în ordonare În prima faz ă a algoritmului fiecare bucket este procesat începând de la ultima variabilă c ătre prima Procesarea variabilei X constă în aplicarea unui operator de eliminare de variabile În urma aplic ării unei astfel de proceduri, rezultă o nou ă func Ńie definită peste aproape toate variabilele din bucket cu excep Ńia lui X Această func Ńie rezum ă efectul variabilei X Ea este introdus ă într-un bucket inferior În cea de-a doua faz ă, aloritmul construie te o solu Ńie asignând o valoare fiec ărei variabile Ordinea de asignare este cea considerată iniŃial În acestă etap ă 157 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială sunt consultate rela Ńiile create în cadrul primei faze Algoritmul este prezentat mai jos procedure BE-MaxCSP( R) begin 1 Ini Ńializare: parti Ńioneaz ă rela Ńiile în bucket1, , bucketn, unde bucketi con Ńine rela Ńiile care au variabila cea mai îndep ărtat ă Xi Fie S1, , Sj scopurile rela Ńiilor din bucket -ul procesat 2 Backward : for p ← n pân ă la 1 for h1, h2, , hj din bucketp if bucketp con Ńine o instan Ńiere Xp=xp then { asigneaz ă variabila Xp cu valoarea xp pentru fiecare rela Ńie hi ; adaug ă rela Ńiile rezultate în bucket -urile corespunz ătoare; } else p { genereaz ă func Ńia hp:∑=jiXhhmin; =ip1 j }{pipXSU-=U; 1i= adaug ă hp la bucket -ul corespunz ător variabilei cu indexul cel mai mare din Up; } 3 Forward : asigneaz ă valori variabilelor în ordinea considerat ă a î combina Ńia de func Ńii din fiecare bucket s ă fie optimizat ă; return asignarea optim ă i func Ńia calculat ă în bucket -ul corespunz ător primei variabile end Algoritmii de acest tip au avantajul cunoa terii a-priori a performan Ńei lor, performan Ńă ce poate fi m ărginită de un parametru al grafului, lăŃ imea indus ă w* Pentru definirea acestei valori, avem nevoie de următoarele no Ńiuni L ăŃ imea unui nod într-un graf ordonat ( G, d) este egală cu num ărul de p ărin Ńi ai nodului Graful indus al unui graf ordonat ( G, d) este graful reprezentat prin perechea ( G* ,d) unde G* este ob Ńinut prin procesarea nodurilor grafului iniŃial G Procesarea unui nod rezultă în conectarea p ărintilor acestuia L ăŃ imea indus ă a grafului ordonat ( G,d), w*(d) este egală cu lăŃ imea grafului indus ( G* ,d) L ăŃ imea indus ă a unui graf, w* este lăŃ imea indus ă minimală peste toate ordon ările 158 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială a) b) Figura 5 8: graful indus al problemei de 3-colorare din Exemplul 5 4, construit pentru a) ordonarea d1=(X4, X2, X3, X1, X5) i b) ordonarea d2=(X5, X1, X2, X3, X4); noile arce sunt reprezentate prin linii întrerupte (X3X4) În exemplul de mai sus lăŃ imea indus ă a grafului indus ( G* ,d1) este 3 , iar în cel de-al doilea caz, pentru ( G* ,d2), este 2 Complexitatea timp i spa Ńiu a algoritmului Bucket-Elimination este exponen Ńială în lăŃ imea indus ă a grafului de interac Ńiune a problemei pentru o ordonare dată Valoarea lăŃ imii induse poate varia pentru ordon ări diferite, ceea ce implic ă complexităŃ i diferite Exemplul 5 7: considerăm aceea i problem ă de 3-colorare din Exemplul 5 4 Primii doi pa i ai algoritmului sunt eviden Ńiati în Figura 5 9, pentru ordonarea d1=( X4, X2, X3, X1, X5) bucket(X5): X5≠X2, X5≠X3, X5≠X1 bucket(X5): X5≠X2, X5≠X3, X5≠X1 bucket(X1): X1≠X2, X1≠X3 bucket(X1): X1≠X2, X1≠X3 , RX1X2X3 bucket(X3): X3≠X4 bucket(X3): X3≠X4, RX2X3 bucket(X2): bucket(X2): RX2X4 bucket(X4): bucket(X4): RX4 Figura 5 9 pasul de iniŃializare i pasul Backward ai algoritmului Bucket-Elimination În partea stâng ă avem partiŃionarea iniŃială, iar în dreapta rela Ńiile dup ă procesare Din cele trei constrângeri din bucket -ul 5 rezultă o nou ă rela Ńie între variabilele rămase, X1, X2 i X3, rela Ńie care este copiată în bucket -ul corespunz ător variabilei X1 Această rela Ńie nu mai este binară, ca rela Ńiile iniŃiale, ci con Ńine trei variabile Similar, din procesarea fiec ărui bucket urm ător rezultă câte o rela Ńie nou ă Principalul dezavantaj al algoritmului Bucket-Elimination este complexitatea timp mare dar în special complexitatea spa Ńiu datorată memorării func Ńiilor intermediare Pentru a reduce complexitatea spa Ńiu se pot utiliza algoritmi de aproximare Puterea acestor algoritmi constă în limitarea dimensiunii i/sau a num ărului de func Ńii înregistrate Consisten Ńa locală este un exemplu de inferen Ńă 159 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială aproximată Mini-bucket elimination este deasemeni o schem ă de aproximare care încearc ă s ă elimine dezavantajul amintit prin partiŃionarea bucket -urilor mari în submulŃimi mai mici ( mini-bucket -uri) Această metod ă permite un echilibru controlat între calitatea aproxim ării i complexitatea calculului 5 4 Euristici pentru selectarea variabilelor i a valorilor Când încerc ăm s ă extindem o solu Ńie parŃială, avem de ales urm ătoarea variabilă i valoarea acesteia Aceste decizii sunt importante deoarece pot reduce din verific ările algoritmului de c ăutare, evitând situa Ńiile de blocaj 5 4 1 Ordonarea variabilelor Metodele pentru ordonarea variabilelor se pot împ ărŃi în dou ă categorii: ordon ări statice sau dinamice Aceste euristici îmbun ătăŃ esc pasul de alegere a variabilei urm ătoare în algoritmul backtracking În primul caz, ordinea este specificată înaintea execu Ńiei algoritmului de căutare i nu este modificată apoi Printre cele mai eficiente metode de acest tip amintim euristicile Minimum width (MW) i Maximum cardinality, euristici care utilizeaz ă informa Ńii din graful constrâns MW construie te o ordine în sens invers, de la ultima c ătre prima variabilă, dup ă urm ătorul criteriu: alege variabila cu cele mai pu Ńine conexiuni c ătre variabilele care nu au fost înc ă alese Euristica Maximum cardinality selecteaz ă iniŃial o variabilă aleatoare i apoi la fiecare pas alege variabila conectată cu o mulŃime maximală de variabile deja alese În cazul unei ordon ări dinamice, alegerea variabilei urm ătoare depinde de starea curentă Ordonarea dinamic ă nu se poate aplica pentru to Ńi algoritmii de căutare Spre exemplu, pentru backtracking nu există informa Ńie suplimentară care să poată diferen Ńia între variabile În cazul algoritmilor Forward-checking sau Arc- consisten Ńă, starea curentă include domeniile restrânse ale variabilelor Subproblema care trebuie rezolvată de ace ti algoritmi se modific ă dup ă fiecare asignare Astfel o ordonare dinamic ă, în care urm ătoarea variabilă de asignat este selectată pe baza informa Ńiilor despre starea curentă ar putea conduce la o performan Ńă mai bun ă a algoritmilor O metod ă des întâlnită de alegere a variabilei urm ătoare este selectarea celei mai constrânse variabile (euristica Minimum Remaining Values MRV) Altfel spus variabila cu domeniul curent cel mai mic urmeaz ă a fi asignată la pasul urm ător Motivul acestei decizii se bazeaz ă pe urm ătoarea idee: este mai eficient a elimina cât mai multe posibilităŃ i cât mai devreme Variabila selectată minimizeaz ă factorul de ramificare al nodului curent, adic ă num ărul de direc Ńii posibil de explorat Exemplul 5 8: în cazul problemei de colorare din Figura 5 2, dup ă asign ările X1=R i X3=V, domeniul variabilei X5 va con Ńine o singură valoare, deci ar fi mai avantajos s ă asign ăm lui X5 culoarea albastru decât s ă asign ăm o valoare variabilelor X2 sau X4 care au câte dou ă valori în domeniu Există situa Ńii în care dimensiunea domeniului variabilelor este aceea i În multe probleme (de exemplu, problema reginelor) domeniile iniŃiale au aceea i dimensiune Putem alege în acest caz variabila care constrânge cel mai mult spa Ńiul 160 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială de c ăutare, adic ă constrânge cât mai multe variabile neasignate Justificarea e c ă încerc ăm astfel s ă reducem factorul de ramificare al nodurilor viitoare Pentru aceea i problem ă de 3-colorare, toate variabilele au domeniile iniŃiale egale, con Ńin cele trei culori posibile Nodurile X1, X3 i X5 au gradul cel mai mare La primul pas alegem unul din aceste noduri Similar, dup ă asignarea culorii ro u pentru variabila X1, domeniile variabilelor X2, X3 i X5 sunt egale Variabilele X3 i X5 au câte dou ă conexiuni c ătre nodurile înc ă neasignate ( X2 are un singur arc) Se alege unul din aceste dou ă noduri la pasul urm ător Tabelul 5 2 exemplific ă pa ii algoritmului Forward-checking combinat cu cele dou ă euristici de selectare a variabilei urm ătoare Tabela 5 2: Execu Ńia algoritmului FC pentru problema din Exemplul 5 2 X1X2X3X4X5 domeniile R, A, V R, A, V R, A, V R, A, V R, A, V initiale dup ă X1=R R A, V A, V R, A, V A, V dup ă X3=V R A, V V R, A A dup ă X5=A R V V R, A A dup ă X2=V R V V R, A A dup ă X4=R R V V R A Această combina Ńie a fost propus ă iniŃial pentru problema colorării grafurilor (euristica lui Brelaz) Se alege drept nod urm ător vârful cu cele mai pu Ńine culori disponibile, iar în caz de egalitate - vârful adiacent cu cel mai mare num ăr de noduri necolorate Această euristic ă furnizeaz ă rezultate bune pentru problema colorării Domeniile au iniŃial aceea i dimensiune i constrângerile sunt similare Euristica exploreaz ă întâi zonele cele mai dense ale grafului Astfel sunt anse mai mari s ă detectăm, înc ă de la începutul c ăutării, o clic ă cu un num ăr de noduri mai mare decât num ărul de culori disponibile i s ă oprim c ăutarea, pe motiv c ă problema e inconsistentă Pentru probleme CSP generale, în care aceste condiŃii nu au loc, există metode care dau rezultate mai bune De exemplu, dacă unele constrângeri sunt mai dificil de satisfăcut decât altele, atunci ar fi de preferat s ă asign ăm valori variabilelor implicate în aceste constrângeri mai întâi, indiferent de dimensiunea domeniului 5 4 2 Selectarea valorilor Algoritmul de c ăutare trebuie s ă aib ă definită o ordine în care vor fi asignate valorile variabilelor O ordonare bun ă a valorilor poate avantaja procesul de c ăutare O direc Ńie care conduce la o solu Ńie este verificată mai devreme decât cele care conduc la situa Ńii de blocaj Această situa Ńie este valabilă pentru cazul în care se dore te determinarea unei solu Ńii În cazul în care dorim s ă identific ăm toate solu Ńiile problemei, sau în caz de inconsisten Ńă, această ordine nu conteaz ă atât de mult În majoritatea cazurilor, se alege valoarea cea mai pu Ńin constrâns ă, care maximizeaz ă deci op Ńiunile viitoare de instan Ńiere 161 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Pe baza principiului de mai sus s-au mai propus i alte câteva metode pentru selectarea valorii variabilei curente Se verific ă pentru fiecare valoare în parte domeniile variabilelor viitoare (similar procedurii Forward-checking) Se alege valoarea cu costul cel mai mic, unde costul este dat de procentul de valori din domeniile viitoare care nu vor mai putea fi utilizate O altă variantă propus ă constă în selectarea celei mai “promiŃătoare” valori, adic ă cu cea mai mare valoare pentru produsul dimensiunii domeniilor variabilelor viitoare Aceste variante sunt din p ăcate destul de costisitoare În general, beneficiul alegerii unei valori care are o probabilitate mai mare de a conduce c ătre o solu Ńie nu este contrabalansat de efortul depus în Forward-checking pentru fiecare valoare În cazuri particulare, există informa Ńie suplimentară care poate fi utilizată pentru selectarea unei astfel de valori O descriere a tehnicilor generale de rezolvare a problemelor de satisfacere a constrângerilor poate fi consultată i în tutorialul on-line al lui Bartak (vezi Bartak, R în referin Ńe) 5 5 Metode stochastice Deoarece majoritatea problemelor din lumea reală sunt supra-constrânse i nu au o solu Ńie exactă, este preferat un algoritm de c ăutare stochastic ă pentru o rezolvare mai rapid ă a problemei Abord ări bazate pe metaeuristici i paradigme inspirate din natură s-au dovedit a fi eficiente în domeniul inteligen Ńei artificiale aplicate i cel al optimiz ării combinatorii Au fost încercate i pentru problemele de satisfacere a constrângerilor metode de c ăutare locală, ca euristicile min-conflicts, stochastic local search, sau metaeuristici precum algoritmii genetici (Craenen, 2003) Algoritmii de c ăutare locală pornesc cu o asignare completă, i la fiecare pas, încearc ă s ă o îmbun ătăŃ easc ă prin modificarea valorii unei variabile Asignarea iniŃială este generată aleator sau utilizând o metod ă deterministă Func Ńia de evaluare a unei astfel de solu Ńii poate fi, în cazul problemelor CSP, num ărul de constrângeri violate Variabila a c ărei valoare va fi modificată, respectiv noua valoare în cel mai simplu caz, sunt alese aleator De exemplu, pentru problema reginelor, starea iniŃială este o configura Ńie aleatoare a reginelor pe coloane Un pas al algoritmului ar consta în alegerea unei regine i mutarea acesteia pe o altă poziŃie în cadrul coloanei respective Euristica min-conflicts selecteaz ă valoarea care minimizeaz ă num ărul de conflicte Metoda s-a dovedit a fi eficientă pentru problema reginelor: g ăse te solu Ńia dup ă un num ăr mic de itera Ńii Rezultate bune s-au ob Ńinut i pentru probleme de planificare În cazul în care problema nu are solu Ńie, algoritmii stochastici nu pot detecta acest lucru Avantajul utilizarii lor îl constituie faptul c ă pot determina un optim local destul de bun pentru problemele în care algoritmii determiniti nu sunt fezabili 5 6 Concluzii În acest capitol am prezentat o descriere sumară a problemelor de satisfacere a constrângerilor Multe probleme din lumea reală pot fi modelate ca probleme CSP Printre tehnicile de rezolvare a acestora se numară scheme de 162 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială backtracking inteligent i inferen Ńa Euristicile de ordonare a variabilelor i a valorilor îmbun ătăŃ esc c ăutarea Cerin Ńe pentru studen Ńi • să recunoasc ă care probleme pot fi modelate ca probleme CSP - să identifice metoda cea mai potrivită pentru o problem ă CSP Probleme P5 1 Formula Ńi urm ătoarele probleme ca probleme de satisfacere a constrângerilor: • Problema planific ării unei suprafe Ńe dreptunghiulare (rectilinear floor-planning): dată o mulŃime de dreptunghiuri mici, s ă se amplaseze aceste dreptunghiuri pe o suprafa Ńa dreptunghiulară mai mare astfel încât acestea s ă nu se suprapun ă • Pătratul magic: s ă se aranjeze cifre de la 1 la 9 într-un p ătrat de 3x3 astfel încât suma celor 3 numere din fiecare linie, coloan ă i diagonală să fie aceea i • Problema planific ării examenelor: s ă se planifice examenele unei mulŃimi de studen Ńi Pentru fiecare student se cunosc obiectele la care acesta are de sus Ńinut o prob ă Posibilele perioade de timp sunt stabilite apriori CondiŃia principală este ca examenele unui student sa fie programate în perioade diferite P5 2 Modela Ńi problema de mai jos ca o problem ă CSP: Cinci copii sunt în spital i fiecare este vizitat în perioada stabilită pentru vizite de un prieten sau o rud ă Acesta ii aduce dou ă cadouri: ceva de mâncare sau de b ăut i o juc ărie Problema este de a identifica pentru fiecare copil care este vizitatorul s ău i cadourile pe care le-a primit, având date urm ătoarele informa Ńii: Cei cinci copii: Maria, Ana, Petru, tefan, Ioana; Vizitatorii: matu a, tata, prietenul, bunicul, mama; Cadouri: banane, prajitură, jeleuri, suc de portocale, caramele; carte de colorat, minge, papu ă, c ărŃi de joc, carte de pove ti Mai tim în plus: Copilul care a primit p ăpu a nu a primit dulciuri Bananele i c ărŃile de joc au fost date aceleea i fetiŃe Persoana care a cump ărat sucul de portocale nu a fost o rud ă de sex feminin Prietenul lui tefan i-a adus mingea Papu a a fost d ăruită unei fetiŃe Prajitura a fost pentru ziua Mariei Caramelele au fost date unui b ăiat Vizitatorul Ioanei nu a fost o rud ă de sex feminin Bunicul Anei i-a adus dulciurile ei preferate Vizitatorul lui Petru a fost m ătu a lui; el nu a primit cartea de colorat Aplica Ńi algoritmul Arc-consisten Ńa pentru această problem ă P5 3 Fie urmatoarea problem ă de satisfacere a constrângerilor, dată prin graful constrâns din Figura 5 10 Domeniile variabilelor sunt: D1={P, K, B}, D2={U, L, I}, D3={V, U, N}, D4={K, J, E, B} Constrângerile exprim ă ordinea lexicografic ă între variabilele implicate în rela Ńie Descrie Ńi pa ii algoritmului Backjumping pentru această problem ă 163 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială X2 X1 X4 Figura 5 10: graful constrâns P5 4 Considera Ńi problema 8-regine Exemplifica Ńi printr-o situa Ńie utilitatea algoritmului Backjumping relativ la Backtracking P5 5 Modela Ńi problema reprezentată de puzzle-ul de mai jos ca o problem ă CSP Propune Ńi cel pu Ńin dou ă variante de modelare Rezolva Ńi problema utilizând metoda Forward-checking combinată cu euristica MRV de selectare a variabilei i euristica care selecteaz ă valoarea cea mai pu Ńin constrâns ă Descrie Ńi pas cu pas execu Ńia algoritmului SATURN +URANUS =PLANETS P5 6 Fie urm ătoarele opt p ătrate poziŃionate ca în Figura 5 11: Figura 5 11: pătratele neetichetate iniŃial Problema constă în etichetarea p ătratelor cu numere de la 1 la 8 astfel încât etichetele oric ărei perechi de p ătrate adiacente (orizontale, vericale sau diagonale) s ă difere prin cel pu Ńin 2 • Scrie Ńi constrângerile sub form ă de rela Ńii i desenaŃi graful constrâns • Este re Ńeaua arc-consistentă? Daca nu, aduce Ńi-o la o form ă arc-consistentă • Este re Ńeua consistentă? Daca da, da Ńi exemplu de o solu Ńie P5 7 Utiliza Ńi metoda de c ăutare locală min-conflicts pentru a rezolva problema celor 4 regine IniŃial considera Ńi reginele pe diagonala principală Bibliografie Dechter, R (2003) Constraint Processing Morgan Kaufmann Publishers 164 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Tsang, E P K (1993) Foundations of Constraint Satisfaction, Academic Press Dechter, R (1990) Enhancement Schemes for Constraint Processing: Backjumping, Learning, and Cut-set Decomposition Artificial Intelligence, 41: 273-312 Gaschnig, J (1979) Performance Measurement and Analysis of Certain Search Algorithms Technical Report CMU-CS-79-124, Carnegie Mellon University Haralick, M , Elliot, G L (1980) Increasing tree-search efficiency for constraint satisfaction problems Artificial Intelligence, 14: 263–313 Mackworth, A K (1977) Consistency in networks of relations Artificial Intelligence, 8(1): 99 – 118 Dechter, R (1996) Bucket elimination: A unifying framework for probabilistic inference algorithms Uncertainty in Artificial Intelligence (UAI-96) , pages 211–219 Craenen, B G W , Eiben, A E , van Hemert, J I (2003) Comparing Evolutionary Algorithms on Binary Constraint Satisfaction Problems IEEE Transactions on Evolutionary Computation, 7(5) : 424-444 Bartak, R On-line guide to Constraint Programming http://kti ms mff cuni cz/~bartak/constraints/index html 165 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Capitolul 6 Înv ăŃ area automată În ălŃimea unui munte nu este m ăsurată calculând efortul necesar pentru a ajunge în vârf Friedrich Nietzsche 6 1 Descriere generală Înv ăŃ area automată, unul din sub-domeniile de baz ă ale Inteligen Ńei Artificiale, se preocup ă cu dezvoltarea de algoritmi i metode ce permit unui sistem informatic să înve Ńe date, reguli, chiar algoritmi Înv ăŃ area automată presupune în primul rând identificarea i implementarea unei modalităŃ i cât mai eficiente de a reprezenta informa Ńii, în sensul facilitării c ăutării, re-organiz ării i modific ării lor Alegerea modului de a reprezenta aceste date Ńine atât de concep Ńia generală asupra modului de rezolvare a problemei, cât i de caracteristicile datelor cu care se lucreaz ă Înv ăŃ area nu se poate face pe baza unui set foarte mare de cuno tin Ńe, atât din cauza costurilor mari presupuse de acumularea unor baze de informa Ńii mari cât i din cauza complexităŃ ii memorării i prelucrării unui volum mare de informa Ńii În acela i timp îns ă, înv ăŃ area trebuie s ă duc ă la formularea de suficiente “reguli” atât cât s ă permită rezolvarea unor probleme dintr-un spa Ńiu mai larg decât cel pe baza căruia s-a făcut înv ăŃ area Adic ă înv ăŃ area trebuie s ă îmbun ătăŃ easc ă performan Ńa unui sistem nu doar în rezolvarea repetată a unui acela i set de probleme, ci i în rezolvarea unor probleme noi Acest lucru presupune o generalizare a unei metode de rezolvare pentru a acoperi un num ăr cât mai mare de instan Ńe posibile, dar i păstrarea unei specializ ări suficiente pentru a fi identificate corect instan Ńele acceptate Aceasta se poate face fie inductiv, generalizând o problem ă plecând de la un set de exemple, fie deductiv, plecând de la o baz ă de cuno tin Ńe suficiente asupra universului problemei i extrăgând date i reguli esen Ńiale Pentru a putea face acest lucru, un algoritm de înv ăŃ are trebuie s ă fie capabil s ă selecteze acele elemente semnificative pentru rezolvarea unei instan Ńe viitoare a problemei Aceasta alegere se face pe baza unor criterii de selec Ńie numite diagonale inductive O altă componentă esen Ńială al unui algoritm de înv ăŃ are este metoda de verificare, o metod ă capabilă s ă confirme dac ă generaliz ările făcute sau regulile deduse se apropie mai mult de solu Ńia ideală decât starea anterioară a sistemului O prezentare mai detaliată a componentelor esen Ńiale ale unui sistem capabil de înv ăŃ are este făcută în sec Ńiunea a doua a acestui capitol Studiul înv ăŃării automate a dus la descrierea a numeroase metode, variind dup ă scop, date de antrenament, strategia de înv ăŃ are i modalitatea de reprezentare a datelor Sec Ńiunea a treia face o prezentare a principalelor direc Ńii în înv ăŃ area supervizată, ce folose te un set de instan Ńe rezolvate ale problemei pentru a antrena sistemul în vederea rezolv ării unor instan Ńe noi Sec Ńiunea a patra prezintă 166 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială înv ăŃ area prin încurajare, ce implementeaz ă o metod ă de a “răsplăti” sistemul în func Ńie de progresul făcut în g ăsirea unei solu Ńii optime Algoritmii genetici, prezenta Ńi în sec Ńiunea a cincea, folosesc metode de reprezentare i c ăutare similare mecanismelor biologice Sec Ńiunea a asea prezintă înv ăŃ area bazată pe cuno tin Ńe, ce deduce solu Ńii pe baza unor cuno tin Ńe anterioare asupra domeniului problemei Sec Ńiunea a aptea face o prezentare a dezavantajelor conceptului de înv ăŃ are supervizată, iar apoi în sec Ńiunea a opta se descrie înv ăŃ area nesupervizată i problema clasific ării 6 2 Caracteristici ale unui sistem capabil de înv ăŃ are Specificarea unei metode de înv ăŃ are automată presupune definirea urm ătoarelor date: - scopul metodei i baza de cuno tin Ńe necesară; - formalismul de reprezentare a datelor utilizate i a celor înv ăŃ ate; - un set de opera Ńii asupra datelor disponibile i înv ăŃ ate; - un spa Ńiu general al problemei în care se va specifica solu Ńia; - op Ńional, reguli euristice pentru c ăutarea în spa Ńiul problemei 6 2 1 Scopul metodei i baza de cuno tin Ńe necesar ă O metod ă de înv ăŃ are este definită în primul rând de datele de plecare i scopul algoritmului, adic ă ce se dore te s ă se ob Ńin ă pe baza acestor date Plecând de la aceste caracteristici, avem urm ătoarele variante: - datele de plecare sunt un set de exemple pozitive i negative de instan Ńe ale problemei, algoritmul trebuind s ă g ăseasc ă o generalizare care s ă includ ă instan Ńele pozitive i s ă le exclud ă pe cele negative; - datele de plecare constau într-un set redus de exemple pozitive, iar algoritmul, plecând cu o baz ă de cuno tin Ńe generale asupra domeniului problemei, trebuie s ă fac ă o generalizare; - datele de plecare sunt un set de instan Ńe neclasificate, algoritmul trebuind să identifice clase de instan Ńe cu proprietăŃ i similare; - date de plecare sub forma uneia sau a mai multor instan Ńe ce descriu situa Ńii ca fiind analogii ale problemei de rezolvat, algoritmul trebuind s ă identifice elementele ce formeaz ă analogia i s ă deduc ă solu Ńia problemei Datele din baza de cuno tin Ńe mai sunt caracterizate i de acurate Ńea i calitatea lor Cel ce înva Ńă trebuie s ă Ńin ă cont de încrederea în sursa de informa Ńii i de detalierea i gradul de organizare a informa Ńiilor Anumite date ce ar putea contribui semnificativ la acurate Ńea unei metode de înv ăŃ are, dac ă ar fi prezente în baza de cuno tin Ńe, pot fi prea greu de ob Ńinut Raportul pre Ń / câtig de informa Ńie trebuie avut în vedere atât în crearea bazei de cuno tin Ńe cât i în descrierea metodelor de înv ăŃ are 6 2 2 Formalismul de reprezentare a datelor utilizate i a celor înv ăŃ ate Conceptele i instan Ńele problemei utilizate în algoritmul de înv ăŃ are trebuiesc formalizate ca expresii sau obiecte cu proprietăŃ i cuantificabile i clar definite Reprezentarea acestor proprietăŃ i se face în general într-o form ă structurată, cum ar fi un tabel sau un graf 167 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Un exemplu de descriere a unor instan Ńe folosind logica propoziŃională este: mărime(obj1,mic ă) ٨culoare(obj1,ro ie) ٨forma(obj1,rotund ă) mărime(obj2,mare) ٨culoare(obj2,ro ie) ٨forma(obj2,rotund ă) iar descrierea unui concept general pentru instan Ńe de tipul celor de mai sus ar fi: mărime(x,y) ٨culoare(x,z) ٨forma(x,rotund ă) 6 2 3 Setul de opera Ńii Algoritmul trebuie s ă aib ă la dispoziŃie unelte care s ă îi permită manipularea datelor în reprezentarea specific ă Opera Ńiile necesare sunt în general cele de generalizare i specializare a unui concept, de modificare i ad ăugare de instan Ńe i expresii, de c ăutare în spa Ńiul problemei Operatorii de generalizare i specializare sunt esen Ńiali în orice algoritm de înv ăŃ are Tipurile principale de generaliz ări folosite sunt: - înlocuirea constantelor cu variabile; Exemplu: culoare(obj1,ro ie) se generalizeaz ă culoare(x,ro ie) ٧culoare(x,y) - renun Ńarea la condiŃii dintr-o conjunc Ńie; Exemplu: mărime(obj1,mic ă) ٨culoare(obj1,ro ie) ٨ forma(obj1,rotund ă) se generalizeaz ă culoare(obj1,ro ie) ٨forma(obj1,rotund ă) - ad ăugarea unei disjunc Ńii la o expresie; Exemplu: mărime(obj1,mic ă) ٨culoare(obj1,ro ie) ٨ forma(obj1,rotund ă) se generalizeaz ă mărime(obj1,mic ă) ٨culoare(obj1,ro ie) ٨ forma(obj1,rotund ă) ٧mărime(obj1,mare) - înlocuirea unei proprietăŃ i cu o descriere mai generală; Exemplu: culoare(obj1,ro ie) se generalizeaz ă culoare(obj1,culoare de baz ă) Mărimea setului de opera Ńii disponibile i complexitatea lor sunt lucruri care au în general un impact puternic asupra rezultatelor ob Ńinute prin înv ăŃ are, asupra vitezei înv ăŃării De asemenea, opera Ńiile disponibile restrâng solu Ńiile posibile la cele care pot fi ob Ńinute i exprimate prin aceste opera Ńii, deci definirea lor trebuie s ă fie considerată una din cele mai importante etape, atât în descrierea algoritmilor de înv ăŃ are cât i în formularea problemelor pentru sistemele de învăŃ are automată 168 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială 6 2 4 Spa Ńiul general al problemei Limbajul de reprezentare i setul de opera Ńii descriu un spa Ńiu de definiŃie a conceptului problemei Înv ăŃ area constă în “navigarea” prin acest spa Ńiu în scopul ajungerii la un concept-Ńintă sau la noi cuno tin Ńe Dificultatea rezolv ării problemei este direct proporŃională cu complexitatea acestui spa Ńiu general al problemei Evident, dimensiunea sa este strâns legată de formalismul de reprezentare ales i de opera Ńiile descrise pentru aceste reprezentări, lucruri ce sunt făcute odată cu descrierea metodei de înv ăŃ are i formularea problemei Aceasta înseamn ă c ă putem descrie o metod ă de înv ăŃ are rapid ă, pe un spa Ńiu mic de solu Ńii, dar formalismul de reprezentare i opera Ńiile nu vor avea o putere expresiv ă mare Trebuie avut în vedere echilibrul între puterea descriptiv ă i timpul de găsire a unei solu Ńii De asemenea, de aici rezultă i faptul c ă o metod ă de înv ăŃ are concepută pentru o problem ă specific ă se va comporta de obicei mai bine decât o metod ă generală de înv ăŃ are 6 2 5 Reguli euristice pentru c ăutare Ordinea i modalitatea prin care se face c ăutarea în spa Ńiul de solu Ńii al problemei sunt, în general, stabilite printr-un set de reguli euristice Aceste reguli direc Ńioneaz ă algoritmul i îl ajută s ă ia decizii în privin Ńa momentului i felului în care se poate generaliza sau specializa un concept, sau se poate introduce un concept nou Aceste euristici sunt în general descrise odată cu algoritmul propriu- zis, fiind proprii fiec ărei metode de înv ăŃ are Aceste reguli pot lipsi, ele nefiind în general esen Ńiale func Ńion ării algoritmului, ci având doar rolul de a optimiza func Ńionarea sa 6 3 Înv ăŃ area supervizată Înv ăŃ area supervizată este un tip de înv ăŃ are inductiv ă ce pleac ă de la un set de exemple de instan Ńe ale problemei i formeaz ă o func Ńie de evaluare (ablon) care s ă permită clasificarea (rezolvarea) unor instan Ńe noi Înv ăŃ area este supervizată în sensul c ă setul de exemple este dat împreun ă cu clasificarea lor corectă Aceste instan Ńe rezolvate se numesc instan Ńe de antrenament Formal, setul de instan Ńe de antrenament este o mulŃime de perechi atribut-valoare (x,f(x)) , unde x este instan Ńa iar f(x) clasa c ăreia îi aparŃine instan Ńa respectiv ă De exemplu, un set de instan Ńe de antrenament ar putea fi: I1: (culoare(obj1,ro ie) ٨forma(obj1,rotund ă), f(obj1)=”sfer ă”) I2: (m ărime(obj2,mare) ٨forma(obj2,cubic ă), f(obj2)=”cub”) Scopul înv ăŃării este construirea unei func Ńii-ablon care s ă clasifice corect instan Ńele-exemplu, iar pentru un x pentru care nu se cunoa te f(x) s ă propun ă o aproximare cât mai corectă a valorii f(x) 6 3 1 Concepte inv ăŃ abile PAC Teoria Înv ăŃării Computa Ńionale propune o baza teoretic ă pentru sistemele capabile de înv ăŃ are Problema principală care se pune este: cum demonstrăm faptul ca un ablon se apropie de perfec Ńiune în etichetarea oricăror instan Ńe noi? 169 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Fie f func Ńia pe care dorim s ă o aproxim ăm, S un set de instan Ńe de antrenament (x,f(x)) , iar h func Ńia indus ă prin înv ăŃ are Este sau nu h(x) aproape de f(x) , pentru orice x din spa Ńiul instan Ńelor posibile? Argumentul standard este acela c ă h nu poate fi prea departe de f, c ăci h clasific ă corect instan Ńele de antrenament, deci probabil i pe celelalte Deci h este probabil aproximativ corect (PAC) Un concept este înv ăŃ abil PAC dac ă există un algoritm eficient care are o probabilitate mare de a g ăsi o aproximare a conceptului probabil aproximativ corectă Termenul “ inv ăŃ abil PAC” a fost introdus de Valiant (1984) Presupunerea aflată la baza acestei justific ări este aceea c ă instan Ńele de antrenament i instan Ńele de testare sunt uniform distribuite în spa Ńiul instan Ńelor posibile ale problemei Acest lucru este fundamental în justificarea oric ărui rezultat al unei înv ăŃării supervizate Pentru calculul devierii unei func Ńii-ablon h fa Ńa de f, putem defini o func Ńie de eroare E(h) ca fiind: E(h) = Pr(h(x) != f(x) | x din D) unde D este o mulŃime de instan Ńe uniform distribuite în spa Ńiul instan Ńelor posibile ablonul h este numit aproximativ corect dac ă E(h) minge(X) mic(X) => u or(X) fără col Ńuri(X) => rotund(X) Din această baz ă de cuno tin Ńe i din instan Ńa de antrenament: culoare(obj,ro u) ٨mic(obj) ٨rotund (obj) => minge(obj) dorim s ă ob Ńinem un ablon pentru a identifica obiecte cu proprietatea minge(obj) Un algoritm de înv ăŃ are bazat pe explica Ńii va g ăsi justificarea instan Ńei pe baza cuno tin Ńelor, i anume: mic(obj) => u or(obj) uor(obj) ٨rotund(obj) => minge(obj) rotund (obj) Prin generalizare, va fi format ablonul: mic(X) ٨rotund(X) => minge(X) Forma generală a algoritmului de înv ăŃ are bazată pe explica Ńii, când P este premiza, C – concluzia unei reguli din baza de cuno tin Ńe, iar S – ablonul curent propus, este: 181 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială EBL(P,C,S) begin Ts = cel mai general unificator al PxS si CxS; S = SxTs; Tg = cel mai general unificator al PxG si CxG; G = GxTg; if (P i C sunt compatibile cu o instan Ńă de antrenament) begin Ts = cel mai general unificator al PxS si CxS; S = SxTs; end; end G reprezintă lista substitu Ńiilor de generalizare (înlocuire a unei constante cu o variabilă în premiza unei reguli) 6 3 14 Înv ăŃ area bazată pe relevan Ńă Înv ăŃ area bazată pe relevan Ńă este o form ă de înv ăŃ are automată bazată pe o baza de cuno tin Ńe ce con Ńine informa Ńii privind relevan Ńa unor anumite proprietăŃ i ale unei instan Ńe, relativ la apartenen Ńa sa la conceptul Ńintă De exemplu, proprietatea unui obiect de a fi rotund are o relevan Ńă mare în privin Ńa apartenen Ńei sale la conceptul minge, în schimb proprietatea sa de a avea culoarea ro ie este irelevantă Aceasta metod ă presupune ca baza de cuno tin Ńe s ă con Ńin ă dependen Ńe func Ńionale care s ă contribuie la definirea conceptului Algoritmul de înv ăŃ are va încerca, pe această baz ă, s ă g ăseasc ă implica Ńii consistente cu proprietăŃ ile cunoscute ale instan Ńelor de antrenament 6 3 15 Înv ăŃ area inductiv ă bazată pe cuno tin Ńe Înv ăŃ area inductiv ă bazată pe cuno tin Ńe folose te regulile cunoscute i instan Ńele de antrenament pentru a încerca s ă formeze reguli noi care s ă explice proprietăŃ ile care nu sunt justificabile pe baza cuno tin Ńelor anterioare De exemplu, pentru baza de cuno tin Ńe: rotund(X) ٨uor(X) ٨sare(X) => minge(X) mic(X) => u or(X) i instan Ńele: rotund(obj1) ٨mic(obj1) ٨elastic (obj1) ٨sare (obj1) => minge(obj1) rotund(obj2) ٨uor(obj2) ٨elastic (obj2) ٨sare (obj2) => minge(obj2) mic(obj3) ٨sare (obj3) => nu minge(obj3) un algoritm de înv ăŃ are inductiv ă ar observa concordan Ńa între proprietăŃ ile unui obiect uor, elastic i care sare Regula ob Ńinută ar fi: uor(X) ٨elastic (X) => sare(X) 182 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Principalele variante ale înv ăŃării inductive bazate pe explica Ńii sunt rezolu Ńia invers ă i înv ăŃ area top-down Rezolu Ńia invers ă se bazeaz ă pe faptul c ă dac ă un concept poate clasifica o instan Ńă doar pe baza setului de cuno tin Ńe atunci această clasificare se poate demonstra printr-o rezolu Ńie Scopul este de a inversa rezolu Ńia pentru a afla ipotezele iniŃiale de la care a plecat Astfel, pentru un rezolvent C sunt ob Ńinute dou ă clauze C1 i C2 din care, pe baza regulilor cunoscute, se poate ob Ńine C Clauzele finale ob Ńinute astfel devin premisele unei reguli a c ărei concluzie este C Înv ăŃ area top-down este o generalizare a arborilor de decizie pentru a acoperi logica clasic ă Ideea este de a pleca cu o regulă foarte generală, care va fi specializată pentru a acoperi doar datele cunoscute ProprietăŃ ile unei instan Ńe sunt reprezentate ca literali, iar ablonul este un set de clauze ce simuleaz ă un arbore de decizie Plecând de la un concept-Ńintă i un set de instan Ńe de antrenament, un algoritm de înv ăŃ are top-down construie te o clauz ă Horn, iniŃial vid ă, care clasific ă o instan Ńă în conceptul Ńintă La această clauz ă se adaug ă treptat literalii care vor îmbun ătăŃ i cel mai mult acurate Ńea clasific ărilor Algoritmul continu ă pân ă la ob Ńinerea unei clauze care este satisfăcută de o parte a instan Ńelor pozitive de antrenament i de nici o instan Ńă negativ ă de antrenament Clauza apoi este generalizată pentru a acoperi toate instan Ńele pozitive de antrenament Alegerea literalilor ce urmeaz ă s ă fie ad ăuga Ńi se face pe baza unor reguli euristice 6 3 16 Dezavantajele înv ăŃării supervizate Toate metodele de înv ăŃ are prezentate în sec Ńiunile precedente presupun existen Ńa unui set de instan Ńe de antrenament despre care tim dac ă aparŃin sau nu unui concept Ńintă Ele sunt folosite pentru a verifica i direc Ńiona modificarea ablonului înv ăŃ at de algoritm Necesitatea existen Ńei acestor instan Ńe este punctul slab al înv ăŃării supervizate, c ăci ele introduc o serie de probleme, cum ar fi: Problema limbajului de reprezentare: trebuie g ăsită o modalitate de a reprezenta instan Ńele i conceptul-Ńintă într-o form ă care s ă permită verificarea, generalizarea i specializarea unor abloane Un limbaj simplu de reprezentare poate fi g ăsit relativ u or pentru orice domeniu, dar el poate duce la spa Ńii foarte mari de c ăutare a conceptului-Ńintă Inconsisten Ńa datelor: instan Ńele de antrenament i eventualele cuno tin Ńe anterioare ale sistemul pot fi inconsistente cu existen Ńa unui concept Ńintă Erorile pot proveni atât din clasificarea instan Ńelor cât i din incapacitatea limbajului de reprezentare ales de a descrie conceptul Ńintă Descrierea conceptului Ńintă: un algoritm de înv ăŃ are poate s ă nu g ăseasc ă nici un ablon corespunz ător conceptului Ńintă sau poate s ă g ăseasc ă mai multe abloane corespunz ătoare În cazul în care se identific ă mai multor abloane posibile, este probabil ca ele s ă fie inconsistente între ele, deci insuficient de generale 183 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială 6 4 Înv ăŃ area nesupervizată Înv ăŃ area nesupervizată elimin ă complet necesitatea unor instan Ńe de antrenament, deci i problemele legate de acestea Scopul înv ăŃării nesupervizate nu este definit anterior ca un concept Ńintă, algoritmul fiind lăsat singur s ă identifice concepte posibile În general, înv ăŃ area nesupervizată presupune existen Ńa unor instan Ńe neclasificate, un set de reguli euristice pentru crearea de noi instan Ńe i evaluarea unor concepte deduse, eventual un model general al spa Ńiului de cuno tin Ńe în care se g ăsesc aceste instan Ńe Un algoritm de înv ăŃ are nesupervizată construie te concepte pentru a clasifica instan Ńele, le evalueaz ă i le dezvoltă pe cele considerate “interesante” de regulile euristice În general, concepte interesante sunt considerate cele care acoperă o parte din instan Ńe, dar nu pe toate Înv ăŃ area nesupervizată permite identificarea unor concepte complet noi plecând de la date cunoscute Încerc ări de a aplica acest tip de înv ăŃ are în cercetarea tiin Ńific ă au dus la rezultate semnificative Astfel AM (Davis i Lenat, 1982) pleca de la un set de concepte de baz ă din teoria mulŃimilor, un set de opera Ńii de creare a noi concepte prin modificarea i combinarea celor existente, i un set de reguli euristice pentru a alege conceptele interesante Algoritmul a descoperit numerele naturale, conceptul de num ăr prim, precum i o serie de alte concepte din teoria numerelor BACON (Langley, 1987) a fost o încercare de a dezvolta un model computa Ńional de dezvoltare a unor legi cantitative tiin Ńifice noi Folosind date privind rela Ńia între distan Ńele dintre planete i soare i perioada lor de revolu Ńie, BACON a re-descoperit legile lui Kepler privind micarea planetelor Totu i aceste încerc ări s-au dovedit limitate în rezultate Principalul factor ce limiteaz ă num ărul i relevan Ńa conceptelor înv ăŃ ate de acest gen de algoritmi este faptul c ă ele nu pot înv ăŃ a noi metode de a crea i evalua concepte Pentru a ob Ńine rezultate mai relevante, ar trebui întâi descris un set mult mai complex de opera Ńii pentru crearea de noi concepte, precum i nite reguli euristice mai flexibile pentru evalua aceste concepte 6 4 1 Identificarea claselor de instan Ńe Un domeniu în care înv ăŃ area nesupervizată i-a dovedit utilitatea este cel al identific ării automate de clase în mulŃimi neclasificate de instan Ńe Această problem ă presupune existen Ńa unei mulŃimi de obiecte negrupate i a unor mijloace de a g ăsi i m ăsura similarităŃ i între aceste obiecte Scopul unui algoritm de identificare a unor clase de obiecte este de a grupa obiectele într-o ierarhie de clase dup ă criterii cum ar fi maximizarea similarităŃ ii obiectelor din aceea i clas ă Ierarhia de clase este reprezentată de obicei ca un arbore, fii unui nod reprezentând categorii distincte dar incluse în categoria p ărinte În privin Ńa înv ăŃării automate aplicate la identificarea claselor de instan Ńe există dou ă abord ări principale: taxonomia numeric ă i gruparea conceptuală Taxonomia numeric ă se bazeaz ă pe reprezentarea unui obiect ca o colec Ńie de atribute cuantificabile Dac ă reprezentăm un obiect ca un vector numeric de proprietăŃ i, atunci similaritatea dintre dou ă obiecte cu n proprietăŃ i reprezintă distan Ńa dintre reprezentările vectorilor respectivi în spa Ńiul n-dimensional Un algoritm de clasificare bazată pe taxonomia numeric ă pentru mulŃimea de obiecte O are forma: 184 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială CalsificareTaxonomica(O) begin do { selecteaz ă din O perechea (X,Y) de obiecte cu cel mai mare grad de similaritate; elimin ă X i Y din O; formeaz ă o clas ă nou ă definit ă de f(X,Y), unde f este de obicei func Ńia medie aritmetic ă; while (exist ă un obiect din O pentru care gradul de similaritate cu clasa nou definit ă este mai mare de un prag S) begin adaug ă obiectul la clas ă; elimin ă obiectul din O; end; } while (O nu este mul Ńime vid ă) end Algoritmul poate fi extins i la obiecte reprezentate ca seturi de simboluri i nu vectori numerici Singurul obstacol este g ăsirea unei metode de a m ăsura similarităŃ ile dintre obiecte O solu Ńie simplă este de a calcula gradul de similaritate ca fiind proporŃia dintre num ărul de proprietăŃ i comune i num ărul total de proprietăŃ i Cu cât această proporŃie va fi mai aproape de 1, cu atât obiectele respective vor avea ansa mai mare de a aparŃine aceleia i clase Dezavantajul acestei metode de clasificare stă în faptul c ă nu Ńine cont de rolul semantic al proprietăŃ ilor obiectelor De exemplu, pentru obiectele: obiect1 = (rotund, ro u, mic) obiect2 = (p ătrat, ro u, mic) obiect3 = (rotund, verde, mare) va fi g ăsit un grad de similaritate mai mare între obiect1 i obiect2 decât între obiect1 i obiect3, de i proprietatea mai relevantă ar trebui s ă fie rotund i nu ro u i mic Această metod ă formeaz ă deci clase prin aprecieri subiective asupra apropierii dintre obiecte, i nu folose te nici un mecanism de a diferen Ńia proprietăŃ ile în func Ńie de relevan Ńa lor în clasificare Un alt dezavantaj constă în faptul c ă această metod ă de clasificare nu construie te definiŃia conceptelor pe baza c ărora clasific ă obiectele Clasele sunt reprezentate extensional (ca o enumerare de obiecte) i nu intensional, ca un ablon de recunoa tere a obiectelor fiec ărei clase Gruparea conceptuală rezolv ă această problem ă prin folosirea unor metode de înv ăŃ are automată pentru a defini concepte plecând de la o baz ă de cunotin Ńe asupra domeniului clasific ării Forma generală a unui algoritm de înv ăŃ are pentru clasificarea conceptuală, a a cum a fost descris în CLUSTER/2 (Michalski si Stepp, 1983), este: ClasificareConceptuala(O) begin 185 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială do { selecteaz ă k obiecte din O (la întâmplare sau folosind o func Ńie de selec Ńie); do { for ( fiecare obiect selectat ) folosind obiectul ca instan Ńă pozitiv ă i celelalte obiecte selectate ca instan Ńe negative, construie te o defini Ńie general ă a conceptului clasei construite în jurul obiectului selectat; clasific ă toate obiectele din O folosind defini Ńiile claselor ob Ńinute; for (fiecare defini Ńie) while ( obiecte din celelalte clase nu sunt acoperite de aceast ă defini Ńie ) generalizeaz ă defini Ńia fiec ărei clase; folosind o metod ă numeric ă, caut ă elementul cel mai apropiat de centrul fiec ărei k clase formate; } while (nu s-au format clase satisf ăcătoare i num ărul de încerc ări e mai mic decât un prag stabilit); } while (nu au fost ob Ńinute clase satif ăcătoare); end 6 4 2 Structura cuno tinŃelor taxonomice Algoritmii de înv ăŃ are supervizată i metodele de clasificare prezentate mai sus definesc o clas ă printr-o serie de atribute necesare i suficiente pentru apartenen Ńa la acea clas ă De i eficientă în multe situa Ńii, această definiŃie nu permite o clasificare flexibilă i structurată a a cum întâlnim în conceptele umane De exemplu, un om poate recunoa te un obiect ca fiind un exemplu mai bun al unei categorii, iar alt obiect un exemplu mai prost O vrabie este un exemplu mai bun al conceptului pas ăre decât un pinguin Această diferen Ńiere nu este permis ă de definiŃia clasic ă a unei clase Teoria asem ănării familiale (Wittgestein, 1953) d ă o definiŃie mai apropiată de cea uman ă pentru o clas ă Astfel, o clas ă este definită de sistemul complex de similarităŃ i între membrii ei, nu de o serie de atribute necesare i suficiente pentru apartenen Ńa la acea clas ă Această definiŃie permite, în extremis, ca membrii unei clase s ă nu aib ă nici m ăcar o proprietate comun ă Un exemplu ar fi cel al clasei sport, ai c ărei membri diferă prin num ărul de juc ători, regulile de joc, precum i alte proprietăŃ i, totu i clasa este bine definită i neambigu ă Clasific ările umane mai diferă de cele formale i prin identificarea unor clase de baz ă mult mai relevante în clasificare decât generaliz ările sau specializ ările lor Conceptul autoturism este mai util în descrierea unui obiect decât generalizarea sa vehicul sau o specializare a sa cabrioletă În spatele unui astfel de concept de baz ă sunt mai multe informa Ńii recunoscute de un clasificator uman, dar nu i de un sistem automat de clasificare Orice metod ă ce îi propune s ă identifice clase noi de obiecte trebuie s ă Ńin ă cont de mecanismul clasific ării umane COBWEB (Fisher, 1987) este un algoritm de clasificare ce îi propune s ă se apropie de modelul uman COBWEB recunoa te clase de baz ă i grade de apartenen Ńă la clase COBWEB este un algoritm de înv ăŃ are incremental ă 186 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială ce define te un num ăr optim de clase plecând de la un set de instan Ńe neclasificate Clasele sunt reprezentate printr-un set de proprietăŃ i, fiecare valoare posibilă a unei proprietăŃ i având ata ată probabilitatea P(pi=vij | ck) ca proprietatea pi să aib ă valoarea vij pentru un obiect aparŃinând clasei ck Atunci când prime te o instan Ńă nou ă, COBWEB consideră utilitatea plas ării instan Ńei într-o clas ă existentă sau a cre ării unei noi clase plecând de la acea instan Ńă Criteriul folosit pentru evaluarea calitativ ă a unei clasific ări se nume te utilitatea claselor (Gluck i Corter, 1985) Acest criteriu încearc ă sa maximizeze atât probabilitatea ca obiectele din aceea i categorie s ă aib ă valori comune pentru o proprietate cât i probabilitatea ca obiecte din categorii diferite s ă aib ă valori diferite ale aceleia i proprietăŃ i Utilitatea claselor se calculeaz ă pentru toate clasele ck , toate proprietăŃ ile pi i toate valorile posibile vij ale acelei proprietăŃ i, ca: ∑k∑i∑jP(pi=vi) P(pi=vi | ck) P(ck | pi=vi) jjj Maximizarea acestei sume înseamn ă îmbun ătăŃ irea modului în care sunt construite clasele Algoritmul COBWEB este definit, pentru intrările Nod i Instan Ńă, dup ă cum urmeaz ă: Cobweb (Nod, Instan Ńă ) begin if (Nod este nod frunz ă) then begin creaz ă doi fii ai nodului Nod, F1 i F2; ini Ńializeaz ă probabilit ăŃ ile din F1 cu cele din Nod; ini Ńializeaz ă probabilit ăŃ ile din F2 cu cele din Instan Ńă ; adaug ă Instan Ńă la Nod, modificând corespunz ător probabilt ăŃ ile; end; else begin adaug ă Instan Ńă la Nod, modificând corespunz ător probabilit ăŃ ile; for ( fiecare descendent D al Nod) calculeaz ă utilitatea claselor ob Ńinute prin includerea Instan Ńă în D; fie S1 scorul ob Ńinut de cel mai bun set de clase D1; fie S2 scorul ob Ńinut de al doilea mai bun set de clase D2; fie S3 scorul ob Ńinut dac ă am plasa Instan Ńă într- o clas ă nou ă; fie S4 scorul ob Ńinut dac ă am reuni D1 i D2 într- un set de clase; fie S5 scorul ob Ńinut dac ă am înlocui D1 cu fii săi; end; 187 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială if ( S1 este cel mai bun scor ) then Cobweb(D1, Instan Ńă ); else if ( S3 este cel mai bun scor ) then ini Ńializeaz ă probabilit ăŃ ile din noua clas ă cu cele din Instan Ńă ; else if ( S4 este cel mai bun scor ) then begin fie Dn setul de clase ob Ńinut prin reunirea D1 i D2; Cobweb (Dn, Instan Ńă ); end; else if ( S5 este cel mai bun scor ) then begin înlocuie te D1 cu fii s ăi; Cobweb (Nod, Instan Ńă ); end; end Algoritmul face o c ăutare în spa Ńiul taxonomiilor posibile folosind utilitatea claselor pentru a evalua i selecta seturile posibile de clase IniŃial, pleac ă cu o singură clas ă cu probabilităŃ ile primei instan Ńe primite Pentru fiecare instan Ńă ulterioară, algoritmul parcurge arborele de clase (format iniŃial dintr-o singură clas ă) i evalueaz ă cel mai bun pas, dintre variantele: - adaug ă o noua clas ă formată din instan Ńa nou ă; - adaug ă instan Ńa nou ă la clasa existentă la care se potrive te cel mai bine; - reune te dou ă clase existente în una singură i adaug ă instan Ńa la clasa rezultată; - înlocuie te o clas ă existentă cu fiii ei i adaug ă instan Ńa la clasa rezultată la care se potrive te cel mai bine COBWEB este un algoritm eficient ce produce taxonomii cu un num ăr rezonabil de clase Prezintă tendin Ńa de a grupa instan Ńe în clase de baz ă, i datorită utiliz ării probabilităŃ ilor, acceptă no Ńiunea de grad de apartenen Ńă la o clas ă 6 5 Concluzii Înv ăŃ area automată tradiŃională se bazeaz ă pe un model conceptual ra Ńional al lumii fizice Pe baza acestui model s-au ob Ńinut structuri de reprezentare tot mai complexe, strategii de c ăutare mai eficiente i progrese semnificative atât în crearea unor sisteme ce simuleaz ă aspecte ale inteligen Ńei biologice, cât i în în Ńelegerea modului în care func Ńioneaz ă inteligen Ńa uman ă Ideea unui model conceptual ra Ńional al lumii fizice se bazează îns ă pe tradiŃia filozofic ă ra Ńionalistă, care îns ă nu modeleaz ă i felul în care ra Ńioneaz ă inteligen Ńa biologic ă Inteligen Ńa uman ă are la baz ă atât ra Ńionamente logice i tiin Ńifice cât i ra Ńionamente empirice, esen Ńiale mai ales în interpretarea necunoscutului Acest lucru a dus la crearea de noi metode de modelare a inteligen Ńei, cum ar fi re Ńelele neuronale i algoritmii genetici, sau la includerea unor ra Ńionamente empirice similare celor umane în algoritmi de înv ăŃ are mai tradiŃionali Rezultatele 188 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială semnificative date de aplicarea acestor noi idei promit crearea unor sisteme tot mai inteligente, pân ă la crearea primei inteligen Ńe artificiale reale Probabil, prima inteligen Ńă artificială veritabilă nu va fi creată de programatori umani, ci de un sistem artificial ce va înv ăŃ a s ă fie inteligent observând instan Ńele date de ra Ńionamentele umane Metodele înv ăŃării automate au devenit instrumente de baz ă în implementarea sistemelor complexe de inteligen Ńă artificială Există numeroase centre de cercetare i conferin Ńe anuale având ca principal domeniu dezvoltarea i evaluarea metodologiilor de înv ăŃ are automată (vezi bibliografia) Tendin Ńa generală de a crea sisteme informatice tot mai independente i adaptabile face studiul Înv ăŃării Automate unul dintre cele mai atractive domenii de cercetare în Inteligen Ńa Artificială Datorită limitărilor de spa Ńiu, acest capitol prezintă doar o parte din algoritmii de înv ăŃ are existen Ńi, având ca scop doar atragerea interesului cititorului pentru documentare suplimentară în acest domeniu Cerin Ńe pentru studen Ńi Să fie familiariza Ńi cu cel pu Ńin dou ă metode de înv ăŃ are automată (dintre care una – ID3) Să poate recunoa te cele mai indicate metode de înv ăŃ are aplicabile unei probleme reale Probleme P6 1 Da Ńi exemple de aplica Ńii pentru care înv ăŃ area automată nu poate fi aplicată în practic ă Explica Ńi P6 2 Da Ńi exemple de metode de înv ăŃ area automată pentru fiecare din categoriilei: înv ăŃ are supervizată, fără surse de cunoa tere înv ăŃ are supervizată, cu surse de cunoa tere înv ăŃ are nesupervizată P6 3 Un supervizor d ă scoruri pentru stările unui joc de ah (situa Ńia de pe tablă la un moment dat) Un program de înv ăŃ are poate recunoa te mutările optime la un moment dat, alegând cea care duce la starea cu scor maximal Dac ă îns ă programul de înv ăŃ are nu ar dispune de exemplele de antrenament, cum ar putea înv ăŃ a mutările optime? P6 4 Pentru construirea unui set de exemple de antrenament putem genera stări ce vor fi evaluate de un supervizor, urmând una din metodele urm ătoare: se genereaz ă la întâmplare o stare legală a pieselor de pe tablă; se genereaz ă o stare plecând de la alta deja evaluată, din care se execută o mutare legală Care din cele dou ă metode este mai eficientă (în sensul maximiz ării stărilor relevante pentru înv ăŃ are – cu câ tig maxim de informa Ńie) P6 5 ConstruiŃi arborele ID3 pentru instan Ńele de antrenament din tabela 6 2 Apoi repeta Ńi pentru înv ăŃ area conceptului de umiditate, în loc de optim ski, utilizând atributele corespunz ătoare din instan Ńele de antrenament 189 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Tabela 6 2 InstaŃe de antrenare pentru exerciŃiul 6 5 Zi prognoza cer temperatura umiditatea vântul Optim ski? 1 optimistă senin cald mare slab nu 2 optimistă înnourat cald mare puterninc nu 3 neutră înnourat cald mare slab da 4 proastă senin optim mare slab da 5 proastă senin frig normală slab da 6 proastă senin frig normală puterninc nu 7 neutră senin frig normală puterninc da 8 optimistă înnourat optim mare slab nu 9 optimistă senin frig normală slab da 10 proastă înnourat optim normal slab da 11 optimistă înnourat optim normală puterninc da 12 neutră senin optim mare puterninc da 13 neutră senin cald normală slab da 14 proastă înnourat optim mare puterninc nu P6 6 ConstruiŃi arborele ID3 pentru descrierea func Ńiei: (A^B)xor(CvD) P6 7 Dac ă A1 i A2 sunt arbori de decizie i A2 îl con Ńine pe A1, poate fi A2 rescris ca un arbore format din A1 i un alt arbore de decizie A3 ata at la una sau mai multe noduri terminale din A1? Explica Ńi i da Ńi exemple P6 8 Da Ńi o solu Ńie mai rapid ă decât ID3 pentru înv ăŃ area automată a unor reguli de clasificare pentru instan Ńele din tabela 6 2 P6 9 Ce poate fi înv ăŃ at aplicând EBL pentru instan Ńele de antrenament: Ia i (aproape (Boto ani), aeroport (da), drum (Boto ani)) Boto ani (aproape (Ia i), aeroport (nu), drum (Ia i)) i baza de cuno tin Ńe: A: drum (B) ^ aproape (B) => condus (A, B) A: aeroport (da) => zbor (A, any) condus (A, B) ^ zbor (B, any) => zbor (A, any) P6 10 Descrie Ńi o metod ă de a reformula automat conceptul Ńintă pentru un algoritm de înv ăŃ are supervizat în cazul insuficien Ńei datelor de antrenament Exemple 190 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Bibliografie Alpaydin E 2004 Introduction To Machine Learning, MIT Press Davis, R i Lenat, D B 1982 Knowledge-Based Systems in Artificial Intelligence New York: McGraw-Hill International Book Company, pp 1-225 DeJong G, Mooney R 1986 Explanation-based learning An alternative view, Machine Learning Fisher, D H 1987 Knowledge acquisition via incremental conceptual clustering Machine Learning 2: 139–172 Fisher, D H 1991 Concept Formation: Knowledge and Experience in Unsupervised Learning, Lawrence Erlbaum Gluck, M A i Corter, J E 1985 Information, uncertainty, and the utility of categories În Proceedings of the Seventh Annual Conference of the Cognitive Science Society, 283 287 Hillsdale, NJ: Lawrence Erlbaum Jebara T 2004 Machine Learning: discriminative and generative, Springer Langley, P 1987 A General Theory of Discrimination Learning In Production System Models of Learning and Development, Eds D Klahr, P Langley & R Neches, MIT Press Michalski R S i Stepp R E 1983 Learning from observation: Conceptual clustering În R S Michalski, J G Carbonell, and T M Mitchell, editors, Machine Learning: An AI Approach, volume 1, pages 331-364 Morgan Kaufmann Publishers Mill, J S 1843 Collected Works, Toronto: University of Toronto Press, 1963-89), XIII, 566 Mitchell T M 1997 Machine Learning, McGraw-Hill Mitchell, T M 1982 Generalization as search Artificial intelligence, March, 18(2), 203–226 Mitchell, T M 1978 Version spaces: An approach to concept learning PhD thesis, Department of Electrical Engineering, Stanford University Also Stanford CS reports STAN-CS-78-711, HPP- 79-2 Quinlan J R 1986 Induction of Decision Trees, Machine Learning Quinlan J R 1993 Programs for Machine Learning, Morgan Kaufmann 191 Cristea, IoniŃă, Pistol – Inteligen Ńa Artificială Quinlan, J R 1983 Learning Efficient Classification Procedures And Their Application To Chess End Games , Michalski, Ryszard S , J G Carbonell T M Mitchell, : Machine Learning - An Artifical Intelligence Approach, 463-482 Tioga Publishing Company Shannon C E 1948 A Mathematical Theory of Communication, Bell System Technical Journal, Vol 27, pp 379–423, 623–656 Shavlik J , Mooney R J , Towell G G 1991 Machine Learning, Morgan Kaufmann Utgoff P 1988 ID5: An incremental ID3 In Proceedings of the Fifth International Conference on Machine Learning, pages 107-120, Ann Arbor, MI, Morgan Kaufmann Valiant, L G 1984 A theory of the learnable Communications of the ACM 1984 pp1134-1142 Weiss S M , Kuliowski G 1993 Computational systems that learn: classification and prediction methods from statistics, neural nets, machine learning and expert systems, Morgan Kaufmann Widrow, B i Hoff, M E 1960 Adaptive switching circuits în IRE WESCON, pag 96-104, New York Convention Record Wittgestein L 1953 Philosophical Investigations, New york, Macmillan Site-uri utile: Colec Ńie de site-uri despre Machine Learning: http://www aaai org/AITopics/html/machine html Cursuri disponibile on-line: http://www cs iastate edu/~honavar/Courses/cs673/machine-learning- courses html Conferin Ńe i asocia Ńii : European Conference on Machine Learning: http://www ecmlpkdd2007 org/ Knowledge Discovery and Data: http://www acm org/sigs/sigkdd/kdd/2007/ Association for the Advancement of Artificial Intelligence's National Conferene on Artificial Intelligence: http://www aaai org/Conferences/AAAI/aaai07 php 192 